从 collections.OrderedDict 生成 pandas 数据框

发布于 2025-01-19 06:05:39 字数 898 浏览 4 评论 0原文

我必须从此网站 和制作数据flame 。

我试图对XML进行操作,然后传递到DataFrame,

from urllib.request import urlopen
import xmltodict
from collections import OrderedDict
from io import StringIO
from collections import OrderedDict, Counter
import pandas as pd


file = urlopen('https://analisi.transparenciacatalunya.cat/download/8s6p-h233/text%2Fxml')
data_bytes = file.read()
orderDictListData = xmltodict.parse(data_bytes)
orderDictListData 
df = pd.DataFrame(orderDictListData)

我需要一个数据框,因为键“ ID”,直到“ CodiIineMunicipi”这样,例如:

“

I have to open this xml file from this website and make a dataframe.

I tried to pas a xml to dict and then pass to dataframe

from urllib.request import urlopen
import xmltodict
from collections import OrderedDict
from io import StringIO
from collections import OrderedDict, Counter
import pandas as pd


file = urlopen('https://analisi.transparenciacatalunya.cat/download/8s6p-h233/text%2Fxml')
data_bytes = file.read()
orderDictListData = xmltodict.parse(data_bytes)
orderDictListData 
df = pd.DataFrame(orderDictListData)

I need a dataframe since key "id" until "codiINEmunicipi" like that:

enter image description here

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

若水般的淡然安静女子 2025-01-26 06:05:39

如何简单地使用 A>:

url = 'https://analisi.transparenciacatalunya.cat/download/8s6p-h233/text%2Fxml'
df = pd.read_xml(url)

输出:

     id                                                   nom                                                                        carrec tractament                 resp  iddep                                                                     dep  idpare codidep          nif   ordre datamodificacio datacreacio  centres  sinonims
0   535                                 012 Atenció Ciutadana                                                                          None       None                 None   3392  Departament de la Vicepresidència i de Polítiques Digitals i Territori    6564     PTO         None  912000      02/06/2021  19/06/1997      NaN       NaN
1  3383                                      061 Salut Respon                                                                          None       None                 None   2803                                                    Departament de Salut    7021     SLT         None    1000      23/02/2021  19/06/1997      NaN       NaN
2  5500  ACCIÓ - Agència per a la Competitivitat de l'Empresa  consellera delegada de l'Agència per a la Competitivitat de l'Empresa, ACCIÓ       Sra.     Natàlia Mas Guix  19775                                         Departament d'Empresa i Treball   19035     EMO  S-0800476-D  323699      28/02/2022  19/06/1997      NaN       NaN
3  5504                                        ACCIÓ a Girona                                                      delegat d'ACCIÓ a Girona        Sr.        Ferran Rodero  19775                                         Departament d'Empresa i Treball    5500     EMO         None   10500      25/01/2016  19/06/1997      NaN       NaN
4  5505                                        ACCIÓ a Lleida                                                     delegada d'ACCIÓ a Lleida       Sra.  Clara Porta Sànchez  19775                                         Departament d'Empresa i Treball    5500     EMO         None   11500      25/01/2016  19/06/1997      NaN       NaN
...

How about simply using pandas.read_xml:

url = 'https://analisi.transparenciacatalunya.cat/download/8s6p-h233/text%2Fxml'
df = pd.read_xml(url)

output:

     id                                                   nom                                                                        carrec tractament                 resp  iddep                                                                     dep  idpare codidep          nif   ordre datamodificacio datacreacio  centres  sinonims
0   535                                 012 Atenció Ciutadana                                                                          None       None                 None   3392  Departament de la Vicepresidència i de Polítiques Digitals i Territori    6564     PTO         None  912000      02/06/2021  19/06/1997      NaN       NaN
1  3383                                      061 Salut Respon                                                                          None       None                 None   2803                                                    Departament de Salut    7021     SLT         None    1000      23/02/2021  19/06/1997      NaN       NaN
2  5500  ACCIÓ - Agència per a la Competitivitat de l'Empresa  consellera delegada de l'Agència per a la Competitivitat de l'Empresa, ACCIÓ       Sra.     Natàlia Mas Guix  19775                                         Departament d'Empresa i Treball   19035     EMO  S-0800476-D  323699      28/02/2022  19/06/1997      NaN       NaN
3  5504                                        ACCIÓ a Girona                                                      delegat d'ACCIÓ a Girona        Sr.        Ferran Rodero  19775                                         Departament d'Empresa i Treball    5500     EMO         None   10500      25/01/2016  19/06/1997      NaN       NaN
4  5505                                        ACCIÓ a Lleida                                                     delegada d'ACCIÓ a Lleida       Sra.  Clara Porta Sànchez  19775                                         Departament d'Empresa i Treball    5500     EMO         None   11500      25/01/2016  19/06/1997      NaN       NaN
...
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文