Python - 두개의 딕셔너리 병합 (merge)

두개의 dictionary를 병합(merge)하는 방법을 소개합니다.

1. 두개의 딕셔너리의 모든 요소를 병합

d1.update(d2)는 d2를 d1에 병합합니다.

  • 딕셔너리 d1은 요소가 추가되어 데이터가 변경되며, d2는 변경이 없습니다.
  • 두개의 딕셔너리가 동일한 key를 갖고 있을 때, d2의 값으로 변경됩니다.
d1 = {'a': 1, 'b': 2, 'c': 3}
d2 = {'d': 4, 'e': 5, 'f': 6}

d1.update(d2)

print('d1:', d1)
print('d2:', d2)

Output:

d1: {'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5, 'f': 6}
d2: {'d': 4, 'e': 5, 'f': 6}

2. 새로운 딕셔너리에 두개의 딕셔너리를 병합

dict(d1, **d2)는 d1과 d2를 새로운 딕셔너리에 병합하고, 딕셔너리를 리턴합니다.

  • 딕셔너리 d1, d2의 원본 데이터는 변형되지 않습니다.
  • 두개의 딕셔너리의 모든 요소가 합쳐진 새로운 딕셔너리 객체가 리턴됩니다.
  • 두개의 딕셔너리가 동일한 key를 갖고 있을 때, d2의 값으로 변경됩니다.
d1 = {'a': 1, 'b': 2, 'c': 3}
d2 = {'d': 4, 'e': 5, 'f': 6}

d3 = dict(d1, **d2)

print('d1:', d1)
print('d2:', d2)
print('d3:', d3)

Output:

d1: {'a': 1, 'b': 2, 'c': 3}
d2: {'d': 4, 'e': 5, 'f': 6}
d3: {'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5, 'f': 6}

3. 중복된 key의 value는 새로운 값으로 변경

일반적으로, 두개의 딕셔너리를 병합할 때 중복된 key가 있으면 나중에 업데이트되는 key의 value로 변경됩니다.

아래 예제에서 d1의 'c': 3과 d2의 'c': 4는 중복된 key를 갖고 있습니다. 이것을 병합할 때 d2의 value로 업데이트됩니다. 즉, 'c': 4가 됩니다.

d1 = {'a': 1, 'b': 2, 'c': 3}
d2 = {'c': 4, 'd': 5, 'e': 6}

d3 = dict(d1, **d2)

print('d3:', d3)

Output:

d3: {'a': 1, 'b': 2, 'c': 4, 'd': 5, 'e': 6}

4. 중복된 key의 value는 이전 값을 유지

중복된 key가 있을 때, 새로운 값으로 변경하지 않고 기존 값을 유지하도록 만드려면, dict()update()의 변수 순서를 바꾸면 됩니다.

d1 = {'a': 1, 'b': 2, 'c': 3}
d2 = {'c': 4, 'd': 5, 'e': 6}

d3 = dict(d2, **d1)

print('d3:', d3)

Output:

d3: {'c': 3, 'd': 5, 'e': 6, 'a': 1, 'b': 2}

5. 중복된 key의 value를 모두 리스트에 저장

defaultdict를 사용하면 중복된 key가 있을 때, 리스트에 두개의 딕셔너리의 값을 모두 저장할 수 있습니다.

from itertools import chain
from collections import defaultdict

d1 = {'a': 1, 'b': 2, 'c': 3}
d2 = {'c': 4, 'd': 5, 'e': 6}

d3 = defaultdict(list)

for k, v in chain(d1.items(), d2.items()):
    d3[k].append(v)

print(d3)

for k, v in d3.items():
    print(k, v)

Output:

defaultdict(<class 'list'>, {'a': [1], 'b': [2], 'c': [3, 4], 'd': [5], 'e': [6]})
a [1]
b [2]
c [3, 4]
d [5]
e [6]

6. 리스트를 값으로 갖고 있는 딕셔너리 병합

value가 리스트인 두개의 딕셔너리 병합할 때, 아래와 같이 구현할 수 있습니다.

동일한 key가 있으면 리스트를 병합하고, 없으면 새로운 key를 추가하여 기존 리스트를 저장하면 됩니다.

d1 = {'a': [1, 2], 'b': [3, 4]}
d2 = {'c': [5, 6], 'a': [7, 8, 9]}

for key, value in d2.items():
    if key in d1:
        d1[key].extend(value)
    else:
        d1[key] = value

print('d1:', d1)

Output:

d1: {'a': [1, 2, 7, 8, 9], 'b': [3, 4], 'c': [5, 6]}

만약 리스트 안의 중복 요소가 있고, 중복을 제거하고 싶다면 간단한 방법으로 set를 이용하여 제거할 수 있습니다.

d1 = {'a': [1, 2], 'b': [3, 4]}
d2 = {'c': [5, 6], 'a': [1, 7, 8, 9]}

for key, value in d2.items():
    if key in d1:
        d1[key].extend(value)
        d1[key] = list(set(d1[key]))
    else:
        d1[key] = value

print('d1:', d1)

Output:

d1: {'a': [1, 2, 7, 8, 9], 'b': [3, 4], 'c': [5, 6]}

References

Loading script...

Related Posts

codechachaCopyright ©2019 codechacha