提取包含两个可能的字符串之一的列
我正在浏览许多TXT文件,这些文件具有不一致的数据命名实践。 我想提取包含特定数据的列,但是它具有几个不同的名称,具体取决于文件,通常在标头列中的位置不同。
到目前为止,我有:
if "Var_version1" in df1.columns or 'Var_version2' in df1.columns:
df2 = df1[["Other_var1","Other_var2","Var_version1"]].copy()
if或循环是正确的,但是提取是在我意识到不同命名约定之前就持有的。 如果标题中包含其名称中的特定字符串或替代字符串,该如何提取整列? (注意:标题名称可以是xxxxvar_version1xxxx,而不仅仅是var_verison1) 谢谢你!
I am looping through many txt files which have inconsistent data naming practices.
I would like to extract a column which contains specific data, however it has a few different names depending on the file, and often a different location within the header column.
So far I have:
if "Var_version1" in df1.columns or 'Var_version2' in df1.columns:
df2 = df1[["Other_var1","Other_var2","Var_version1"]].copy()
The if or loop is correct, but the extraction is a hold over from before I realized the different naming conventions.
How do I extract the entire column if the header contains a particular string or an alternate string within its name? (note: the header name may be xxxxVar_version1xxxx, not just Var_verison1)
Thank you!
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
您可以使用以下等级或” nofollow noreferrer“>” >过滤器 :
或:
You can use a regex, or list of possibilities combined with
filter
:or: