데이터베이스/데이터베이스 이론

[DB 이론] 데이터베이스 시스템

ReBugs 2023. 10. 14.

이 글은 데이터베이스 개론 (저자 김연희)의 내용을 개인적으로 정리하는 글임을 알립니다.


데이터베이스 시스템의 정의

흔히 데이터베이스, 데이터베이스 관리 시스템, 데이터베이스 시스템을 같은 의미로 사용하지만 각 용어의 개념을 구분하고 관계를 명확히 이해할 필요가 있다.

  • 데이터베이스(DB) : 데이터를 저장해 두는 곳, 데이터의 집합
  • 데이터베이스 관리 시스템(DBMS) : 데이터베이스에 저장된 데이터가 일관되고 무결한 상태로 유지되도록 관리
  • 데이터베이스 시스템(DBS) : 데이터베이스와 데이터베이스 관리 시스템을 이용해 조직에 필요한 정보를 제공해 주는 전체 시스템

데이터베이스와 데이터베이스 관리 시스템은 데이터베이스 시스템의 핵심 구성 요소다.

데이터베이스 시스템은 위에서 설명한 두 가지 말고도 데이터 언어, DB와 DBMS를 설치하고 데이터 처리 연산을 담당하는 컴퓨터로 구성된다.

 

데이터베이스의 구조

스키마

스키마는 DB에 저장되는 데이터 구조와 제약조건을 정의한 것이다.

위 그림은 스키마를 그림으로 간략하게 표현한 것이다.

고객과 관련된 데이터인 고객번호, 이름, 나이, 주소를 저장한다고 가정한다.

고객번호는 정수로, 이름은 최대 10자의 문자열로, 나이는 정수로, 주소는 최대 20자의 문자열만 허용하기로 했다면 이 모든 정해진 내용이 스키마다.

정의된 스키마에 따라 DB에 실제로 저장된 값이 인스턴스다.

보통 스키마는 한번 정의되면 자주 변경되지 않지만(정적), 인스턴스는 계속 변하는(동적) 특성이 있다.

DB 테이블
출처 : 해시넷

 

3단계 데이터베이스 구조

3단계 데이터베이스 구조의 개념

데이터베이스를 3단계로 나누어 이해한다는 개념이다.

  • 외부 단계 : 개별 사용자 입장에서 바라보는 관점
  • 개념 단계 : 조직 전체의 입장에서 바라보는 관점
  • 내부 단계 : 물리적인 저장 장치의 입장에서 바라보는 관점

3단계 데이터베이스 구조를 통해, 모든 데이터의 저장 및 유지와 관련된 복잡한 내용을 숨기고 필요한 데이터만 단순화한 외부 단계의 관점을 일반 사용자들에게 제공할 수 있다.

유선이는 102호의 구조나 크기, 인테리어 등에 관심이 있을 뿐 명석이가 사는 301호나 다른 집이 어떤지는 관심이 없다.
이렇게 유선이나 명석이 관점에서 아파트를 바라보는 것이 외부 단계다.

아파트 관리인은 어느 한 집에만 관심을 두면 안 된다. 아파트를 문제없이 관리하려면 아파트 전체를 잘 알고 있어야 하는데, 이처럼 관리인 관점에서 전체 아파트를 바라보는 것이 개념 단계다.

아파트 건설 업체는 아파트 뼈대, 즉 철근 콘크리트 구조가 어떻게 생겼는지, 시멘트를 얼마나 사용했는지 등을 알고 있어야 하는데, 이처럼 아파트 건설 업체관점에서 전체 아파트를 바라보는 것이 내부 단계이다.

 

외부 단계 (뷰)

외부 단계에서는 개별 사용자 관점에서 데이터베이스를 이해하고 표현한다.

고객 관리를 담당하는 직원은 고객과 관련된 데이터에만, 상품 관리를 담당하는 직원은 상품과 관련된 데이터에만 관심을 가질 것이다.

외부 단계에서는 개별 사용자가 데이터베이스를 어떻게 보는가를 표현하므로 사용자마다 생각하는 데이터베이스 구조가 다르다.

이처럼 외부 단계에서 사용자에게 필요한 데이터베이스를 정의한 것을 외부 스키마라 한다.

외부 스키마는 각 사용자가 생각하는 데이터베이스의 모습을 표현한 논리적인 구조로, 사용자마다 다르다.

하나의 데이터 베이스에는 외부 스키마가 여러 개 존재할 수 있고, 외부 스키마 하나를 사용 목적이 같은 사용자들이 공유할 수 있다.

외부 스키마는 전체 데이터베이스 중 사용자가 관심을 가지는 일부분으로 볼 수 있어 서브 스키마라고도 한다.

 

개념 단계 (테이블)

개념 단계에서는 데이터베이스를 이용하는 사용자들의 관점을 통합하여, 데이터베이스를 조직 전체의 관점에서 이해하고 표현한다.

DBMS나 관리자의 관점에서 모든 사용자에게 필요한 데이터를 통합하여 전체 데이터베이스의 논리적 구조를 정의한다.

이를 개념 스키마라고 한다.

개념 스키마는 조직 전체의 관점에서 생각하는 데이터베이스의 모습이며, 모든 개별 사용자가 생각하는 데이터베이스의 모습을 하나로 합친 형태다.

개념 스키마는 전체 데이터베이스에 어떤 데이터가 저장되는지, 데이터들 간에는 어떤 관계가 존재하고 어떤 제약조건이 있는지에 대한 정의뿐만 아니라, 데이터에 대한 보안 정책이나 접근 권한에 대한 정의도 포함한다.

하지만 데이터를 물리적으로 저장하는 방법이나 데이터 저장 장치와는 독립적이다.

하나의 데이터베이스에는 개념 스키마가 하나만 존재하고, 각 사용자는 개념 스키마의 일부분을 사용한다.

즉, 외부 스키마는 개념 스키마를 기초로 하여 사용자의 이용 목적에 맞게 만들어진다.

일반적으로 스키마라고 하면 개념 스키마를 의미한다.

 

내부 단계 (인덱스)

내부 단계에서는 데이터베이스를 디스크나 테이프 같은 저장 장치의 관점에서 이해하고 표현한다.

즉, 내부 단계에서는 전체 데이터베이스가 저장 장치에 실제로 저장되는 방법을 정의하며 이를 내부 스키마라고 한다.

내부 스키마는 파일에 데이터를 저장하는 레코드의 구조, 레코드를 구성하는 필드 크기, 인덱스를 이용한 레코드 접근 경로 등을 정의한다.

내부 스키마는 데이터베이스의 개념 스키마에 대한 물리적인 저장 구조를 표현하므로 하나의 데이터베이스에 하나만 존재한다.

외부 단계에는 고객 분석팀과 상품 배송팀 사용자가 존재한다.

두 사용자는 자신의 팀에 필요한 데이터로 구성된 외부 스키마를 각각 가지고 있다.

외부 단계에서는 사용자별로 외부 스키마를 정의하여 불필요한 데이터 접근을 사전에 막아 보안 측면에서도 효과적이다.

개념 단계에는 고객 데이터베이스 전체에 대한 논리적 구조를 정의하는 개념 스키마가 하나 존재한다.

내부 단계에는 고객 데이터베이스를 저장 장치에 저장하는 파일의 레코드 구조를 정의한 내부 스키마가 하나 존재한다.

내부 스키마에 정의된 고객 레코드는 필드 7개로 구성되어 있고, 레코드 총 길이는 70바이트다. 이 내부 스키마는 번호와 연락처 필드에 인덱스를 정의하고 있어, 번호나 연락처 필드의 값을 이용해 해당 고객 레코드에 빠르게 접근할 수 있다.

 

데이터 독립성

하나의 데이터베이스에는 세 가지 유형의 스키마가 존재하지만, 각각의 스키마는 데이터베이스를 바라보는 관점이 다를 뿐 모드 같은 데이터베이스를 표현한다.

실제 데이터는물리적 저장 장치에 저장된 데이터베이스에만 존재하므로 사용자가 자신의 외부 스키마를 통해 원하는 데이터를 얻으려면 내부 스키마에 따라 저장된 데이터베이스에 접근해야 한다.

그러므로 세가지 스키마 사이에는 유기적인 대응 관계가 성립해야 한다.

상품 배송팀의 외부 스키마에 있는 고객번호 데이터는 개념 스키마에 있는 번호 데이터에 대응하고, 개념 스키마에 있는 번호 데이터는 내부 스키마에 있는 번호 필드에 대응한다는 연결 관계가 미리 정의되어 있어야 한다.

그래야 사용자가 물리적 저장장치에 저장된 고객번호 데이터에 접근할 수 있다.

스키마 사이의 대응 관계를 사상 또는 매핑이라 한다.

외부 스키마와 개념 스키마는 외부/개념 사상에 의해 대응되고, 개념 스키마와 내부 스키마는 개념/내부 사상에 의해 대응된다.

DBMS는 미리 정의된 외부/개념 사상과 개념/내부 사상 정보를 이용해 사용자가 원하는 데이터에 접근할 수 있다.

 

데이터베이스를 3단계 구조로 나누고, 단계별로 스키마를 유지하며 스키마 사이의 대응 관계를 정의하는 궁극적인 목적은 데이터 독립성을 실현하기 위해서다.

데이터 독립성은 DBMS의 중요한 장점이자 DBMS이 필요한 이유이기도 하다.

데이터 독립성은 하위 스키마가 변경하더라도 상위 스키마가 영향을 받지 않는 특성이다.

3단계 데이터베이스 구조에는 논리적 데이터 독립성과 물리적 데이터 독립성이 존재한다.

논리적 데이터 독립성

논리적 데이터 독립성은 개념 스키마가 변경되더라도 외부 스키마가 영향을 받지 않는 것이다.

그래서 전체 데이터베이스의 논리적인 구조가 변경되어도 관련된 외부/개념 사상정보만 적절히 수정해 주면 직접 관련이 없는 사용자를 위한 외부 스키마는 변경할 필요가 없다.

응용 인터페이스
외부/개념 사상은 외부 스키마와 개념 스키마의 대응 관계를 정의한 것으로, 응용 인터페이스라고도 한다.
개념 스키마가 변경되어도 외부 스키마가 영향을 받지 않는다는 것은  결국 외부 스키마의 사용자가 전체 데이터베이스의 논리적 구조가 변경되었다는 사실을 알 필요가 없음을 의미한다.

사용자는 응용 프로그램을 통해 데이터베이스 시스템을 이용하는 경우가 많으므로 사용자와 응용 프로그램을 동일하게 생각한다.

 

물리적 데이터 독립성

물리적 데이터 독립성은 내부 스키마가 변경되더라도 개념 스키마가 영향을 받지 않는 것이다.

그래서 결과적으로 외부 스키마도 영향을 받지 않는다.

물리적 데이터 독립성이 실현되면 데이터베이스의 저장 구조가 변경되어도 관련된 개념/내부 사상 정보만 적절히 수정해 주면 직접적으로 관련이 없는 데이터베이스의 논리적 구조는 영향을 받지 않는다.

저장 인터페이스
개념/내부 사상은 개념 스키마와 내부 스키마의 대응 관계를 정의한 것으로 저장 인터페이스라고도 한다.

 

데이터 사전

저장된 데이터를 올바르게 관리하고 이용하려면 필요한 부가 정보도 저장해야 한다.

대표적인 부가 정보가 스키마와 사상 정보다.

데이터 독립성을 실현하면서 데이터베이스를 다양한 관점에서 이해하기 위해 정의되는 세 가지 스키마에 대한 정보와 스키마 간의 사상 정보도 어딘가에 저장되어 있어야 필요할 때 사용할 수 있다.

데이터베이스에 저장되는 데이터에 관한 정보를 저장하는 곳을 데이터 사전 또는 시스템 카탈로그라고 한다.

데이터 사전은 일반 사전처럼 데이터베이스에 저장되어 있는 데이터를 정확하고 효율적으로 이용하기 위해 참고해야 되는 스키마, 사상 정보, 다양한 제약조건 등을 저장하고 있다.

메타 데이터
데이터베이스에 저장되는 데이터에 관한 정보이므로, 데이터에 대한 데이터를 의미해 메타 데이터라고도 한다.
시스템 데이터베이스, 사용자 데이터베이스
데이터 사전도 데이터를 저장하는 데이터베이스의 일종이기 때문에 시스템 데이터베이스라고도 한다.
사용자가 실제로 이용하는 데이터가 저장되는 일반 데이터베이스를 사용자 데이터베이스라 부르기도 한다.

데이터 사전은 DBMS가 스스로 생성하고 유지하는 것으로, DBMS가 주로 접근하지만 일반 사용자도 접근할 수 있다.

단, DBMS가 데이터를 사전에 내용을 새로 추가하거나 수정할 수 있는 반면, 사용자는 저장 내용을 검색만 할 수 있다.

데이터 사전에 있는 데이터에 실제로 접근하는 데 필요한 위치 정보는 데이터 디렉터리라는 곳에서 관리한다.

데이터 사전, 데이터 디렉터리
데이터 사전과 데이터 디렉터리는 둘 다 시스템을 위한 데이터베이스라는 공통점이 있지만, 데이터 사전은 사용자가 접근할 수 있고 데이터 디렉터리는 시스템만 접근할 수 있다는 차이가 있다.

 

데이터베이스 사용자

데이터베이스를 이용하는 사용자는 매우 다양한데, 이용 목적에 따라 크게 데이터베이스 관리자, 최종 사용자 응용 프로그래머로 나눌 수 있다.

데이터베이스 관리자

데이터베이스 관리자는 데이터베이스 시스템을 운영 및 관리한다.

데이터베이스를 직접 활용하기보다는 조직 내의 사용자를 위해 데이터베이스를 설계 및 구축하고, 제대로 서비스할 수 있도록 데이터베이스를 제어한다.

그래서 데이터베이스 관리자는 데이터 언어 중 주로 데이터 정의어와 데이터 제어어를 이용해 데이터베이스에 접근한다.

 

최종 사용자

데이터를 조작(삽입, 수정, 삭제, 검색) 하기 위해 DB에 접근하는 사람들을 일반 사용자 또는 최종 사용자라 한다.

최종 사용자는 컴퓨터 시스템이나 데이터베이스에 관한 전문 지식을 꼭 갖출 필요는 없다. 그리고 데이터 정의어를 사용할 수도 있지만 주로 데이터 조작어를 사용한다.

 

응용 프로그래머

응용 프로그래머는 프로그래밍 언어로 응용 프로그램을 작성할 때 데이터베이스에 접근하는 데이터 조작어를 삽입하는 사용자다.

데이터 정의어를 삽입할 수도 있지만 주로 데이터 조작어를 삽입한다.

 

데이터 언어

데이터베이스에 사용자를 대신해 데이터베이스를 구축하고 활용 및 관리하는 DBMS에 부탁할 때 사용하는 언어가 있다.

이것이 바로 데이터 언어다.

데이터 언어는 사용자가 데이터베이스를 구축하고 이에 접근하기 위해 DBMS와 통신하는 수단이다.

인간의 언어에 때와 장소에 맞는 용법이 있는 것처럼 데이터 언어에도 상황에 따른 용법이 있다.

데이터 언어는 DBMS의 정의, 조작, 제어 기능을 이용하기 위한 수단이기 때문에 사용 목적에 따라 데이터 정의어, 데이터 조작어, 데이터 제어어로 나뉜다.

이는 하나의 데이터 언어를 기능에 따라 내부적으로 구분 짓는 것일 뿐 독립적으로 존재하는 언어들은 아니다.

 

데이터 정의어(DDL)

새로운 데이터베이스를 구축하기 위해 스키마를 정의하거나 기존 스키마의 정의를 삭제 또는 수정하기 위해 사용하는 데이터 언어

데이터 정의어로 정의된 스키마는 데이터 사전에 저장되고, 삭제나 수정이 발생하면 이 내용도 데이터 사전에 반영된다.

데이터 사전에 저장된 스키마 정보는 사용자나 DBMS이 필요할 때 참고할 수 있다.

명령어 기능
CREATE SCHEMA, DOMAIN, TABLE, VIEW, INDEX를 정의
ALTER Table에 대한 정의를 변경하는데 사용
DROP SCHEMA, DOMAIN, TABLE, VIEW, INDEX를 삭제

 

데이터 조작어(DML)

사용자가 데이터의 삽입, 삭제, 수정, 검색 등의 처리를 DBMS에 요구하기 위해 사용되는 데이터 언어

데이터 정의어를 이용해 스키마를 정의하면 스키마에 따라 조직에 필요한 실제 데이터 값(인스턴스)이 저장되는데, 사용자가 실제 데이터 값을 활용하기 위해 사용하는 것이 데이터 조작어이다.

데이터 조작어는 설명 방식에 따라 아래의 두 가지로 나눈다.

  • 절차적 데이터 조작어 : 사용자가 어떤 데이터를 원하고 해당 데이터를 얻으려면 어떻게 처리해야하는지 구체적으로 설명
  • 비절차적 데이터 조작어 : 사용자가 어떤 데이터를 원하는지만 설명
명령어 기능
SELECT 테이블에서 조건에 맞는 튜플을 검색
INSERT 테이블에 새로운 튜플을 삽입
DELETE 테이블에서 조건에 맞는 튜플을 삭제함
UPDATE 테이블의 조건에 맞는 튜플의 내용을 변경함

 

데이터 제어어(DCL)

데이터베이스에 저장된 데이터를 여러 사용자가 무결성과 일관성을 유지하며 문제없이 공유할 수 있도록, 내부적으로 필요한 규칙이나 기법을 정의하는 데 사용하는 데이터 언어다.

데이터베이스 관리자가 데이터 관리를 목적으로 사용하는 언어이다.

명령어 기능
COMMIT 데이터베이스 조작 작업이 정상적으로 완료되었음을 관리자에게 알림
ROLLBACK 데이터베이스 조작 작업이 비정상적으로 종료되었을 때 원래의 상태로 복구
GRANT 데이터베이스 사용자에게 사용 권한을 부여함
REVOKE 데이터베이스 사용자의 사용 권한을 취소함

 

 

DBMS의 구성

질의 처리기

사용자의 데이터 처리 요구를 해석하여 처리하는 역할을 담당하고, 다음의 주요 구성 요소들을 포함한다.

  • DDL 컴파일러 : 데이터 정의어로 작성된 스키마의 정의를 해석한다. 그리고 저장 데이터 관리자의 도움을 받아 새로운 데이터베이스를 구축하고, 스키마의 정의를 데이터 사전에 저장한다. 데이터 정의어로 작성된 기존 스키마의 삭제나 수정 요청도 처리하여, 변경된 내용을 데이터 사전에 적용한다.
  • DML 프리 컴파일러 : 응용 프로그램에 삽입된 데이터 조작어를 추출하여 DML 컴파일러에 전달한다. 단, 데이터 조작어와 관련 없는 나머지 코드들은 해당 언어의 컴파일러에 보내진다.
  • DML 컴파일러 : 데이터 조작어로 작성된 데이터의 처리(삽입 ·삭제·수정·검색) 요구를 분석하여 런타임 데이터베이스 처리기가 이해할 수 있도록 해석한다.
  • 런타임 데이터베이스 처리기 : 저장 데이터 관리자를 통해 데이터베이스에 접근하여, DML 컴파일러로부터 전달받은 데이터 처리 요구를 데이터베이스에서 실제로 실행한다.
  • 트랜잭션 관리자 : 데이터베이스에 접근하는 과정에서 사용자의 접근 권한이 유효한지를 검사하고, 데이터베이스 무결성을 유지하기 위한 제약조건 위반 여부를 확인한다. 회복이나 병행 수행과 관련된 작업도 담당한다.


저장 데이터 관리자

저장 데이터 관리자는 디스크에 저장된 데이터베이스와 데이터 사전을 관리하고, 여기에 실제로 접근하는 역할을 담당한다.

그런데 디스크에 저장된 데이터에 접근하는 것은 운영체제의 기본 기능이므로 저장 데이터 관리자는 운영체제의 도움을 받아 데이터베이스에 대한 접근을 수행한다.

댓글