[Django] ORM Cookbook, 정보를 조회하고 필요한 항목을 선별하는 방법(2)

웹프로그래밍/Django

[Django] ORM Cookbook, 정보를 조회하고 필요한 항목을 선별하는 방법(2)

ssung.k 2020. 8. 27. 19:34

해당 포스팅은 Django ORM CookBook 을 공부하며 새로 알게된 사실이나 더 나아가 추가적으로 같이 알면 좋을 내용을 정리하고 있습니다.

10. JOIN

SQL에서는 JOIN문을 이용해 동일한 값을 가진 열을 기준으로 두 테이블을 결합할 수 있습니다.

django에서도 JOIN을 할 수 있는 방법이 존재합니다.

select_related

모든 Post를 가져오는 간단한 쿼리를 살펴봅시다.

post_all = Post.objects.all()

이에 대한 SQL 질의문입니다.

놀랍게도 Post에 대한 질의문과 Post와 OneToOne으로 연결되어 있는 User에 대한 질의가 함께 이루어집니다.

Post가 N개 있다면 각 Post에 해당하는 User를 조회하기 위해 N번의 추가적인 질의가 이루어집니다.

SELECT `post_post`.`id`, `post_post`.`user_id`, `post_post`.`title`, `post_post`.`content`
FROM `post_post`

SELECT `accounts_user`.`id`, `accounts_user`.`password`, 
`accounts_user`.`email`
FROM `accounts_user` 
WHERE `accounts_user`.`id` = 2;

SELECT `accounts_user`.`id`, `accounts_user`.`password`, 
`accounts_user`.`email`
FROM `accounts_user` 
WHERE `accounts_user`.`id` = 2;

이번에는 select_related 를 사용하여 봅시다.

post = Post.objects.select_related('user')

이에 대한 SQL 질의문입니다.

JOIN을 하기 때문에 더 복잡한 쿼리를 생성하지만 하나의 쿼리로 해결합니다.

SELECT `post_post`.`id`, `post_post`.`user_id`, `post_post`.`title`, `post_post`.`content`, `accounts_user`.`id`, `accounts_user`.`password`, `accounts_user`.`email`, 
FROM `post_post` 
INNER JOIN `accounts_user` 
ON (`post_post`.`user_id` = `accounts_user`.`id`)

추후에 post에 대한 user에 접근할 때도 DB에 접근하지 않습니다.

post[0].user

11. N번째 항목

django ORM에서 첫번째 항목과 마지막 항목은 각각 first() 와 last() 를 통해 구할 수 있습니다.

하지만 N번째 항목에 대해서는 따로 메서드를 제공하지 않습니다.

그렇기 때문에 N번째 항목에 대해서는 파이썬 인덱싱을 통해 구하게 됩니다.

user = User.objects.order_by('-last_login')[1]

이 때 SQL 질의문은 LIMIT OFFSET 구문을 사용하여 필요한 데이터만 가져옵니다.

SELECT `accounts_user`.`id`, `accounts_user`.`password`, `accounts_user`.`last_login`, `accounts_user`.`email`
FROM `accounts_user` 
ORDER BY `accounts_user`.`last_login` DESC  LIMIT 1 OFFSET 1;

12. 특정 열의 값이 동일한 항목

이번에는 특정 열의 값이 동일한 항목을 찾아봅시다.

User 모델 중 social이 서로 동일한 사용자를 구한다고 가정합시다.

이 때는 Count 를 구한 후 이를 통해 찾을 수 있습니다.

from django.db.models import Count

duplicates = User.objects.values('social').annotate(social_count=Count('social'))
# <QuerySet [{'social': 'NONE', 'social_count': 2}, {'social': 'KAKAO', 'social_count': 1}]>

SELECT `accounts_user`.`social`, COUNT(`accounts_user`.`social`) AS `social_count` FROM `accounts_user` GROUP BY `accounts_user`.`social` ORDER BY NULL

이제 social_count 가 1보다 큰 값들에 대해서만 쿼리를 만들어줍니다.

duplicates = User.objects.values('social').annotate(social_count=Count('social')).filter(social_count__gt=1)
# <QuerySet [{'social': 'NONE', 'social_count': 2}]>

SELECT `accounts_user`.`social`, COUNT(`accounts_user`.`social`) AS `social_count` 
FROM `accounts_user` 
GROUP BY `accounts_user`.`social` 
HAVING COUNT(`accounts_user`.`social`) > 1 ORDER BY NULL

위에서 날린 duplicates를 이용하여 겹치는 User를 아래와 같이 구할 수 있습니다.

users = User.objects.filter(social__in=[item['social'] for item in duplicates])

SELECT `accounts_user`.`id`, `accounts_user`.`password`, `accounts_user`.`email`, `accounts_user`.`social` 
FROM `accounts_user` 
WHERE `accounts_user`.`social` IN ('NONE')

13. 고유한 필드 값을 가지는 항목

고유한 필드 값을 가지는 항목을 구해봅시다.

이름이 다른 사용자와 겹치지 않는 User는 아래와 같이 구할 수 있습니다.

distinct = User.objects.values(
    'nickname'
).annotate(
    name_count=Count('nickname')
).filter(name_count=1)

records = User.objects.filter(first_name__in=[item['nickname'] for item in distinct])

sql은 12 와 유사하여 생략하도록 하겠습니다.

저작자표시 (새창열림)