python操作xml——ElementTree(元素树)方式

tag:即标签，用于标识该元素表示哪种数据，即APP_KEY

attrib:即属性，用Dictionary形式保存，即{'channel'='CSDN'}

text,文本字符串，并不是必须的。

如下图：

<data>这样的用<>括起来的为标签，

<country name='Liechtenstein'>中name="Liechtenstein"为属性，用字典形式表示

<rank>1<rank>中的1为标签rank的text

可以用obj.tag, obj.attrib, obj.text分别获取上述三种值，obj为树节点对象

需要的包：两种套路

扫描二维码关注公众号，回复： 4064465 查看本文章

第一种：import xml.etree.ElementTree as ET

则对应操作如下：

in_file = open(xml_file_path)

tree=ET.parse(in_file) #打开xml文件好像可以直接ET.parse(xml_file_path)

实际上ET.parse函数内部就是用的第二种方法~

root = tree.getroot() #获取根节点

第二种：from xml.etree.ElementTree import ElementTree,Element

#遍历整个文档树用ElementTree，遍历单独的节点或者子节点用Element

则对应操作如下：

tree=ElementTree()

tree.parse(xml_file_path)

root=tree.getroot()

找到根节点后，则可以进行各种操作

查找子节点:

递归查找所有子节点：obj.iter('Name')。

非递归查找所有子节点：obj.findall('Name')

obj.find('Name')

obj.find('difficult').text #obj的子节点difficult节点的值，obj为某一节点

假如：obj=root.find('xxx'),此时obj为节点对象，需要改其text，只需要obj.text=新值

一个模板，modify_xml_info模板

#!/usr/bin/python  
# -*- coding=utf-8 -*-  
from xml.etree.ElementTree import ElementTree,Element 
#遍历整个文档树用ElementTree，遍历单独的节点或者子节点用Element 
  
def read_xml(in_path):  
    '''''读取并解析xml文件 
       in_path: xml路径 
       return: ElementTree'''  
    tree = ElementTree()  
    #prese()解析xml文件
    tree.parse(in_path)  
    return tree  
  
def write_xml(tree, out_path):  
    '''''将xml文件写出 
       tree: xml树 
       out_path: 写出路径'''  
    tree.write(out_path, encoding="utf-8",xml_declaration=True)  
  
def if_match(node, kv_map):  
    '''''判断某个节点是否包含所有传入参数属性 
       node: 节点 
       kv_map: 属性及属性值组成的map'''  
    for key in kv_map:  
        if node.get(key) != kv_map.get(key):  
            return False  
    return True  
  
#---------------search -----  
  
def find_nodes(tree, path):  
    '''''查找某个路径匹配的所有节点 
       tree: xml树 
       path: 节点路径'''  
    return tree.findall(path)  
  
  
def get_node_by_keyvalue(nodelist, kv_map):  
    '''''根据属性及属性值定位符合的节点，返回节点 
       nodelist: 节点列表 
       kv_map: 匹配属性及属性值map'''  
    result_nodes = []  
    for node in nodelist:  
        if if_match(node, kv_map):  
            result_nodes.append(node)  
    return result_nodes  
  
#---------------change -----  
  
def change_node_properties(nodelist, kv_map, is_delete=False):  
    '''''修改/增加 /删除 节点的属性及属性值 
       nodelist: 节点列表 
       kv_map:属性及属性值map'''  
    for node in nodelist:  
        for key in kv_map:  
            if is_delete:   
                if key in node.attrib:  
                    del node.attrib[key]  
            else:  
                node.set(key, kv_map.get(key))  
              
def change_node_text(nodelist, text, is_add=False, is_delete=False):  
    '''''改变/增加/删除一个节点的文本 
       nodelist:节点列表 
       text : 更新后的文本'''  
    for node in nodelist:  
        if is_add:  
            node.text += text  
        elif is_delete:  
            node.text = ""  
        else:  
            node.text = text  
              
def create_node(tag, property_map, content):  
    '''''新造一个节点 
       tag:节点标签 
       property_map:属性及属性值map 
       content: 节点闭合标签里的文本内容 
       return 新节点'''  
    element = Element(tag, property_map)  
    element.text = content  
    return element  
          
def add_child_node(nodelist, element):  
    '''''给一个节点添加子节点 
       nodelist: 节点列表 
       element: 子节点'''  
    for node in nodelist:  
        node.append(element)  
          
def del_node_by_tagkeyvalue(nodelist, tag, kv_map):  
    '''''同过属性及属性值定位一个节点，并删除之 
       nodelist: 父节点列表 
       tag:子节点标签 
       kv_map: 属性及属性值列表'''  
    for parent_node in nodelist:  
        children = parent_node.getchildren()  
        for child in children:  
            if child.tag == tag and if_match(child, kv_map):  
                parent_node.remove(child)  
                          
  
  
if __name__ == "__main__":  
      
    #1. 读取xml文件  
    #./表示当前目录，或者不用，直接当前目录下文件名
    tree = read_xml("test.xml")  
      
    #2. 属性修改  
      #A. 找到父节点  
    nodes = find_nodes(tree, "processers/processer")  
      #B. 通过属性准确定位子节点  
    result_nodes = get_node_by_keyvalue(nodes, {"name":"BProcesser"})  
      #C. 修改节点属性  
    change_node_properties(result_nodes, {"age": "1"})  
      #D. 删除节点属性  
    change_node_properties(result_nodes, {"value":""}, True)  
      
    #3. 节点修改  
      #A.新建节点  
    a = create_node("person", {"age":"15","money":"200000"}, "this is the firest content")  
      #B.插入到父节点之下  
    add_child_node(result_nodes, a)  
      
    #4. 删除节点  
       #定位父节点  
    del_parent_nodes = find_nodes(tree, "processers/services/service")  
       #准确定位子节点并删除之  
    target_del_node = del_node_by_tagkeyvalue(del_parent_nodes, "chain", {"sequency" : "chain1"})  
      
    #5. 修改节点文本  
       #定位节点  
    text_nodes = get_node_by_keyvalue(find_nodes(tree, "processers/services/service/chain"), {"sequency":"chain3"})  
    change_node_text(text_nodes, "new text")  
      
    #6. 输出到结果文件  
    write_xml(tree, "./out.xml")

python操作xml——ElementTree(元素树)方式

猜你喜欢