Python-基本爬取的三大格式解析(xml、json、yamal)

HTML旨在显示信息,而 XML 旨在传输信息。
xml和json、yaml都是同一传递信息的协议。

HTML

Python-基本爬取的三大格式解析(xml、json、yamal)

xml

第一种xml最后一个是注释
Python-基本爬取的三大格式解析(xml、json、yamal)
Python-基本爬取的三大格式解析(xml、json、yamal)

json

Python-基本爬取的三大格式解析(xml、json、yamal)
Python-基本爬取的三大格式解析(xml、json、yamal)

yaml

#代表注释
:|表示多行信息
-代表并列关系
Python-基本爬取的三大格式解析(xml、json、yamal)
Python-基本爬取的三大格式解析(xml、json、yamal)

三种格式的比较

描述 场景
xml 最早的通用信息标记语言,可扩展性好,但繁琐 Internet上的信息交互与传递
json 信息有类型,适合程序处理(js),较XML简洁 移动应用云端和节点的信息通信,无助时
yaml 信息无类型,文本信息比例最高,可读性好 各类系统的配置文件,有注释易读