CS 공부

트랜잭션 (Transaction)

신동편 2023. 7. 26. 13:13
728x90

트랜잭션

 

트랜잭션은 데이터베이스에서 하나느이 논리적 기능을 수행하기 위한 작업의 단위를 말한다.

 

데이터베이스에 접근하는 방법은 쿼리이므로, 여러 개의 쿼리들을 하나로 묶는 단위를 말한다.

트랜잭션은 ACID특징을 갖고 있다. Atomicity(원자성), Consistency(일관성), Isolation(격리성), Durability(지속성)의 약어이다.

활동 (Active) : 트랜잭션이 실행 중인 상태

실패 (Failed) : 트랜잭션 실행에 오류가 발생하여 중단된 상태

철회 (Aborted) : 트랜잭션이 비정상적으로 종료되어 롤백 연산을 수행한 상태

부분 완료 (Partial Committed) : 트랜잭션의 마지막 연산까지 실행했으나 커밋 연산이 실행되기 직전의 상태

완료 (Committed) : 트랜잭션이 성공적으로 종료되어 커밋 연산을 실행한 후의 상태


Atomicity(원자성)

 

 

트랜잭션과 관련된 일이 모두 수행되었거나 되지 않았거나를 보장하는 특성이다.

트랜잭션을 커밋했는데, 문제가 생겨 롤백하는 경우 그 이후에 모두 수행되지 않음을 보장하는 것을 말한다.

 

트랜잭션 단위로 여러 로직들을 묶을 때 외부 API를 호출하는 것이 있으면 안 된다. 만약 롤백이 일어났을 때 어떻게 해야 할 것인지에 대한 해결방법이 있어야 하고, 트랜잭션 전파를 신경 써서 관리해야 한다.

 

+ 커밋)

여러 쿼리가 성공적으로 처리되었다고 확정하는 명령어이다. 트랜잭션 단위로 수행되며 변경된 내용이 모누 영구적으로 저장되는 것을 말한다. 커밋이 수행되었다는 것을 하나의 트랜잭션이 성공적으로 수행되었다고도 한다.

 

+ 롤백)

에러나 이슈로 인해서 트랜잭션 전으로 돌리는 것을 롤백이라 한다. 트랜잭션으로 처리한 하나의 묶음 과정을 일어나기 전으로 되돌리는 것이다.

 

+ 트랜잭션 전파) 

트랜잭션을 수행할 때 커넥션 단위로 수행하기 때문에 커넥션 객체를 넘겨서 수행해야 한다. 하지만 이를 매번 넘겨주는 것은 쉽지 않은 작업이다. 이를 넘겨서 수행하지 않고 여러 트랜잭션 관련 메서드의 호출을 하나의 트랜잭션에 묶이도록 하는 것을 트랜잭션 전파라고 한다.

//in Java (Spring Boot)
@Service
@Transactional
@RequiredArgsConstructor
public class SimpleService {
    private final SimpleRepository simpleRepository;
    
    public void saveSimple(Simple simple) {
    	simpleRepository.save(simple);
    }
    
}

위 코드와 같이 Spring 프레임워크에서는 @Transactional 어노테이션을 통해 여러 쿼리 관련 코드들을 하나의 트랜잭션으로 처리할 수 있다.

 

 


Consistency(일관성)

 

 

'허용된 방식'으로만 데이터를 변경해야 하는 것을 의미한다.

데이터베이스에 기록된 모든 데이터는 여러 가지 조건, 규칙에 따라 유효함을 가져야 한다. 

 

예를 들어 통장이라는 데이터베이스가 있고 그 안에 10000원이라는 데이터가 있을 때 그 통장에 20000원을 출금하는 쿼리를 날리는 것은 불가능하다.

 


Isolation(격리성)

 

 

트랜잭션 수행 시 서로 끼어들지 못하는 것을 말한다. 복수의 병렬 트랜잭션은 서로 격리되어 마치 순차적으로 실행되는 것처럼 작동되어야 하고, 데이터베이스는 여러 사용자가 같은 데이터에 접근할 수 있어야 한다.

 

격리성은 여러 개의 격리 수준으로 나뉘어 격리성을 보장한다.

 

격리 수준은 SERIALIZABLE, REPEATABLE_READ, READ_COMMITTED, READ_UNCOMMITTED가 있으며, 위로 갈수록 동시성이 강해지지만 격리성은 약해지고, 아래로 갈수록 동시성은 약해지고 격리성은 강해진다.

 

또한 각 단계마다 나타나는 현상이 있다.

REPEATABLE_READ는 팬텀 리드,

READ_COMMITTED는 팬텀리드, 반복 가능하지 않은 조회가 발생하며,

READ_UNCOMMITTED는 팬텀리드, 반복 가능하지 않은 조회, 더티 리드가 발생할 수 있다.

 

+ 팬텀 리드) 

한 트랜잭션 내에서 동일한 쿼리를 보냈을 때 해당 조회 결과가 다른 경우를 말한다.

 

ex) 사용자 A가 유저 테이블에서 성별이 남자인 사람들을 조회하는 쿼리를 보낸다고 했을 때, 3개의 결과가 나왔다.

그다음 B가 회원가입을 하고 유저 테이블에 성별이 남자인 유저 레코드를 삽입했다. 그러면 그다음 세 개가 아닌 네 개의 결과가 조회되는 것이다.

 

+ 반복 가능하지 않은 조회)

한 트랜잭션 내의 같은 행에 두 번 이상 조회가 발생했는데, 그 값이 다른 경우를 말한다.

팬텀리드와는 다르게 행 값이 달라질 수도 있다. 팬텀 리드는 다른 행이 선택될 수 도 있다는 것을 의미한다.

 

ex) 사용자 A가 물의 양 100L라는 값의 데이터를 조회하였는데 그 값을 사용자 B가 1L로 변경해서 커밋했다고 하면 사용자 A는 100L가 아닌 1L를 읽게 되는 것이다.

 

+ 더티 리드)

반복 가능하지 않은 조회와 유사하며 한 트랜잭션이 실행 중일 때 다른 트랜잭션에 의해 수정되었지만 아직 '커밋되지 않은' 행의 데이터를 읽을 수 있을 때 발생한다.

 

ex) 사용자 A가 물의 양 100L라는 데이터를 40L로 변경한 내용이 커밋되지 않은 상태라도 그 이후 사용자 B가 조회한 결과가 40L로 나오는 경우를 말한다.

 

 

SERIALIZABLE

트랜잭션을 순차적으로 진행시키는 것을 말한다.

 

여러 트랜잭션이 동시에 같은 행에 접근할 수 없다. 이 수준은 매우 엄격한 수준으로 해당 행에 대해 격리시키고, 이후 트랜잭션이 이 행에 대해 일어난다면 기다려야 한다. 따라서 교착 상태가 일어날 확률도 많고 가장 성능이 떨어지는 격리 수준이다.

 

REPEATABLE_READ

하나의 트랜잭션이 수정한 행을 다른 트랜잭션이 수정할 수 없도록 막아주지만 새로운 행을 추가하는 것은 막지 않는다. 따라서 이후에 추가된 행이 발견될 수도 있다.

 

READ_COMMITTED

가장 많이 사용되는 격리 수준이며, 다른 트랜잭션이 커밋하지 않은 정보는 읽을 수 없다. 즉, 커밋 완료된 데이터에 대해서만 조회를 허용한다.

 

하지만 어떤 트랜잭션이 접근한 행을 다른 트랜잭션이 수정할 수 있다. 

때문에 트랜잭션 A가 같은 행을 다시 읽을 때 다른 내용이 발견될 수 있다.

 

READ_UNCOMMITTED

가장 낮은 격리 수준으로, 하나의 트랜잭션이 커밋되기 이전에 다른 트랜잭션에 노출되는 문제가 있지만 가장 빠르다.

데이터 무결성을 위해서 되도록 사용하지 않는 것이 이상적이나, 몇몇 행이 제대로 조회되지 않더라도 괜찮은 거대한 양의 데이터를 '어림잡아' 집계하는 데는 사용하면 좋다.

 


Durability(지속성)

 

 

성공적으로 수행된 트랜잭션은 영원히 반영되어야 하는 것을 의미한다. 이는 데이터베이스에 시스템 장애가 발생하더라도 원래 상태로 복구하는 회복 기능이 있어야 함을 뜻하며, 데이터베이스는 이를 위해 체크섬, 저널링, 롤백 등의 기능을 제공한다.

 

+ 체크섬)

중복 검사의 한 형태로, 오류 정정을 통해 송신된 자료의 무결성을 보호하는 단순한 방법.

 

+ 저널링)

파일 시스템 또는 데이터베이스 시스템에 변경 사항을 반영하기 전에 로깅하는 것, 트랜잭션 등 변경 사항에 대한 로그를 남기는 것. 

 

 

728x90

'CS 공부' 카테고리의 다른 글

TCP / UDP  (0) 2023.07.26
프로세스  (0) 2023.07.06
CPU / 메모리  (0) 2023.06.24