파이썬에서 xml 객체를 생성하고 파일로 저장하는 방법을 소개합니다.
1. xml 객체 생성 및 파일 저장
아래 예제는 국가별 도시 데이터를 갖고 있는 xml 객체를 생성하며 파일로 저장합니다. 코드를 보시면 Root Element를 만들고, 그 아래에 Sub Element를 추가합니다. 최종적으로 ElementTree 객체로 만들고 이 tree 객체의 내용을 파일로 저장합니다.
from xml.etree.ElementTree import Element, SubElement, ElementTree
root = Element("Countries")
element1 = Element("Korea")
root.append(element1)
sub_element1 = SubElement(element1, "City")
sub_element1.text = "Seoul"
element2 = Element("Japanese")
root.append(element2)
sub_element2 = SubElement(element2, "City")
sub_element2.text = "Tokyo"
tree = ElementTree(root)
fileName = "example.xml"
with open(fileName, "wb") as file:
tree.write(file, encoding='utf-8', xml_declaration=True)
위의 코드에서 example.xml
으로 xml 파일을 저장하며, 파일을 확인해보면 아래와 같이 저장되어있습니다.
<?xml version='1.0' encoding='utf-8'?>
<Countries><Korea><City>Seoul</City></Korea><Japanese><City>Tokyo</City></Japanese></Countries>
보기 좋게 바꾸면 이렇습니다.
<?xml version='1.0' encoding='utf-8'?>
<Countries>
<Korea>
<City>Seoul</City>
</Korea>
<Japanese>
<City>Tokyo</City>
</Japanese>
</Countries>
2. xml 객체 생성 및 파일 저장 (Attribute 추가)
1의 예제는 Element만 추가한 xml 형식이었습니다. 아래 예제는 Attribute까지 추가하는 예제입니다. SubElement에서 set(attribute, value)
형식으로 Attribute를 추가할 수 있습니다.
from xml.etree.ElementTree import Element, SubElement, ElementTree
root = Element("Countries")
element1 = Element("Korea")
root.append(element1)
sub_element1 = SubElement(element1, "City")
sub_element1.text = "Seoul"
sub_element1.set("attr1", "value1")
sub_element1.set("attr2", "value2")
element2 = Element("Japanese")
root.append(element2)
sub_element2 = SubElement(element2, "City")
sub_element2.text = "Tokyo"
sub_element2.set("attr1", "value1")
sub_element2.set("attr2", "value2")
tree = ElementTree(root)
fileName = "example.xml"
with open(fileName, "wb") as file:
tree.write(file, encoding='utf-8', xml_declaration=True)
example.xml
파일을 열어보면 아래와 같이 저장됩니다.
<?xml version='1.0' encoding='utf-8'?>
<Countries><Korea><City attr1="value1" attr2="value2">Seoul</City></Korea><Japanese><City attr1="value1" attr2="value2">Tokyo</City></Japanese></Countries>
보기 좋게 바꾸면 아래와 같습니다.
<?xml version='1.0' encoding='utf-8'?>
<Countries>
<Korea>
<City attr1="value1" attr2="value2">Seoul</City>
</Korea>
<Japanese>
<City attr1="value1" attr2="value2">Tokyo</City>
</Japanese>
</Countries>
3. xml 보기 좋게 저장 (Pretty)
1과 2의 예제에서 파일을 열어보면 xml의 text가 Tab과 개행 문자가 모두 제거되어 파일의 크기는 작아졌지만 보기에는 좋지 않았습니다.
xml의 text에 Tab과 개행 문자를 추가하면 보기 좋게 저장할 수 있습니다.
아래 예제는 2의 예제에서 _pretty_print(root)
만 추가되었습니다. _pretty_print()
는 xml 객체의 text에 Tab과 개행문자를 추가하여, 저장될 때 보기 좋게 저장되도록 합니다.
from xml.etree.ElementTree import Element, SubElement, ElementTree
def _pretty_print(current, parent=None, index=-1, depth=0):
for i, node in enumerate(current):
_pretty_print(node, current, i, depth + 1)
if parent is not None:
if index == 0:
parent.text = '\n' + ('\t' * depth)
else:
parent[index - 1].tail = '\n' + ('\t' * depth)
if index == len(parent) - 1:
current.tail = '\n' + ('\t' * (depth - 1))
root = Element("Countries")
element1 = Element("Korea")
root.append(element1)
sub_element1 = SubElement(element1, "City")
sub_element1.text = "Seoul"
sub_element1.set("attr1", "value1")
sub_element1.set("attr2", "value2")
element2 = Element("Japanese")
root.append(element2)
sub_element2 = SubElement(element2, "City")
sub_element2.text = "Tokyo"
sub_element2.set("attr1", "value1")
sub_element2.set("attr2", "value2")
_pretty_print(root)
tree = ElementTree(root)
fileName = "example.xml"
with open(fileName, "wb") as file:
tree.write(file, encoding='utf-8', xml_declaration=True)
example.xml
파일을 열어보면 아래와 같이 저장됩니다.
<?xml version='1.0' encoding='utf-8'?>
<Countries>
<Korea>
<City attr1="value1" attr2="value2">Seoul</City>
</Korea>
<Japanese>
<City attr1="value1" attr2="value2">Tokyo</City>
</Japanese>
</Countries>
4. xml 파일 읽고, 보기 좋게 출력 (1)
다음과 같이 xml.etree.ElementTree
으로 xml 파일을 읽고 출력할 수 있습니다.
import xml.etree.ElementTree as ET
filePath = "./example.xml"
tree = ET.parse(filePath)
ET.dump(tree)
Output:
<Countries><Korea><City>Seoul</City></Korea><Japanese><City>Tokyo</City></Japanese></Countries>
4.1 Tab, 개행 문자 추가하여 보기 좋게 출력
위의 코드에서, _pretty_print()
를 추가로 구현하여, xml 객체의 text에 Tab과 개행 문자를 추가하면 다음과 같이 보기 좋게 출력할 수 있습니다.
import xml.etree.ElementTree as ET
def _pretty_print(current, parent=None, index=-1, depth=0):
for i, node in enumerate(current):
_pretty_print(node, current, i, depth + 1)
if parent is not None:
if index == 0:
parent.text = '\n' + ('\t' * depth)
else:
parent[index - 1].tail = '\n' + ('\t' * depth)
if index == len(parent) - 1:
current.tail = '\n' + ('\t' * (depth - 1))
filePath = "./example.xml"
tree = ET.parse(filePath)
_pretty_print(tree.getroot())
ET.dump(tree)
Output:
<Countries>
<Korea>
<City attr1="value1" attr2="value2">Seoul</City>
</Korea>
<Japanese>
<City attr1="value1" attr2="value2">Tokyo</City>
</Japanese>
</Countries>
5. xml 파일 읽고, 보기 좋게 출력 (2)
아래와 같이 xml.dom.minidom
를 이용하여 xml을 읽고 보기 좋게 출력할 수 있습니다.
import xml.dom.minidom
dom = xml.dom.minidom.parse(fileName)
pretty_xml_as_string = dom.toprettyxml()
print(pretty_xml_as_string)
Output:
<?xml version="1.0" ?>
<Countries>
<Korea>
<City attr1="value1" attr2="value2">Seoul</City>
</Korea>
<Japanese>
<City attr1="value1" attr2="value2">Tokyo</City>
</Japanese>
</Countries>
References
Related Posts
- Python - Yaml 파일 파싱하는 방법
- Python - 파일 내용 삭제
- Python - for문에서 리스트 순회 중 요소 값 제거
- Python - 두 리스트에서 공통 요소 값 찾기
- Python - 문자열 앞(뒤)에 0으로 채우기
- Python - 공백으로 문자열 분리
- Python - 중첩 리스트 평탄화(1차원 리스트 변환)
- Python - 16진수 문자열을 Int로 변환
- Python - 두 날짜, 시간 비교
- Python f-string으로 변수 이름, 값 쉽게 출력 (변수명 = )
- Python - nonlocal과 global 사용 방법
- Python 바다코끼리 연산자 := 알아보기
- Python - pip와 requirements.txt로 패키지 관리
- Python - 딕셔너리 보기 좋게 출력 (pprint)
- Python - Requests 사용 방법 (GET/POST/PUT/PATCH/DELETE)
- Python - 온라인 컴파일러 사이트 추천
- Python - os.walk()를 사용하여 디렉토리, 파일 탐색
- Python - 문자열 비교 방법
- Python - Text 파일 읽고 쓰는 방법 (read, write, append)
- Python - 리스트에서 첫번째, 마지막 요소 가져오는 방법
- Python - 두개의 리스트 하나로 합치기
- Python - 리스트의 마지막 요소 제거
- Python - 리스트의 첫번째 요소 제거
- Python 소수점 버림, 4가지 방법
- Python 코드 안에서 버전 확인 방법
- Python 소수점 반올림, round() 예제
- Python - 리스트 평균 구하기, 3가지 방법
- Python - bytes를 String으로 변환하는 방법
- Python - String을 bytes로 변환하는 방법
- Python 버전 확인 방법 (터미널, cmd 명령어)
- Python - 람다(Lambda) 함수 사용 방법
- Python - dict 정렬 (Key, Value로 sorting)
- Python - range() 사용 방법 및 예제
- Python - 리스트를 문자열로 변환
- Python - 문자를 숫자로 변환 (String to Integer, Float)