删除csv文件中的项目?

问题描述:

我有一个.csv与webstats的四个或五个数据列。删除csv文件中的项目?

我用一个程序分析了数据,我想怎么做,现在我有一个带有我想要的页面列表的文本文件,我想删除我不需要的每个页面的所有数据,以便只保留文本文件中的内容。

即如果我有该.csv如下:

/fruits-and-veggies/apples 16 3 03:43 .72% 
/fruits-and-veggies/pears 8 2 02:34 .65% 
/fruits-and-veggies/broccoli 6 5 04:23 .87% 
/fruits-and-veggies/asparagus 46 6 01:23 .77% 
/fruits-and-veggies/passion-fruit 36 7 05:53 .74% 

和我有文本文件,如下所示:

/fruits-and-veggies/apples 
/fruits-and-veggies/pears 
/fruits-and-veggies/passion-fruit 

如何操作excel文件,因此只读取:

/fruits-and-veggies/apples 16 3 03:43 .72% 
/fruits-and-veggies/pears 8 2 02:34 .65% 
/fruits-and-veggies/passion-fruit 36 7 05:53 .74% 

我对这个主题进行了大量研究,尚未提出一个可行的解决方案。我使用的是Windows XP,批处理文件如果可能会受到青睐,但我真的不知道从哪里开始。

+0

什么是您使用到manipulatexcel文件可能我请你?你想以编程方式或使用Excel功能吗? –

+0

我正在使用批处理文件来读取页面名称(在将该列物理复制并粘贴到指定的“输入”文本文件之后)并吐出那些共享我需要的特征的特征(它们属于一个类别比另一个,他们都共享相同的标题标签)。我想尽可能以编程方式进行。它也可以是一个.csv,如果它使工作更容易,没有偏好。 –

+0

它可能以编程方式完成,如果您熟悉.net(c#或vb),您可以编写一个完成以上所有操作的程序,您可以读取文件名,并且可以使用第三方零件库来操作excel –

我会使用python及其正则表达式模块。如果我没有弄错的话,它实际上甚至有CSV模块。还有很多其他方式/工具可以做到这一点。

我每天都在处理复杂的表格(csv)操作,而且我的工作已经被惊人的python petl库大大缓解了。一旦你使用这个,就没有回头路了,如果你被卡住了,图书馆的作者是非常有帮助的。

如果您不是程序员,请不要担心 - 即使只需极少的脚本编写技巧,您也可以使用csv,text,json以及任何使用petl的表格格式来实现令人惊叹的效果。

看看这个视频:https://www.youtube.com/watch?v=Y0FleNEcO9I

库是在这里:http://petl.readthedocs.org/en/latest/

如果您想尝试,并卡住,ping通我,我会帮你的。

干杯,

PJ