데이터베이스의 정의
통합 데이터(Intergrated Data) : 검색의 효율성을 위해 중복이 최소화된 데이터들의 모임
저장 데이터(Stored Data) : 컴퓨터가 접근 가능한 저장 매체에 저장된 데이터
운영 데이터(Operational Data) : 조직의 목적을 위해 존재 가치가 확실하고 반드시 필요한 데이터
공유 데이터(Shared Data) : 여러 응용 프로그램들이 공동으로 사용하는 데이터
데이터베이스의 특징
실시간 접근성(Real Time Accessibility)
- 사용자의 질의에 대하여 즉시 처리하여 응답하는 특징
계속적인 진화(Continuous Evolution)
- 삽입, 삭제, 갱신을 통하여 항상 최근의 정확한 데이터를 동적으로 유지하는 특징
동시 공유(Concurrent Reference)
- 데이터베이스에 있는 데이터를 참조할 때 튜플의 주소나 위치에 의해서가 아니라 사용자가 요규하는 데이터 내용에 따라 참조하는 특징
데이터의 논리적, 물리적 독립성(Independence)
- 논리적 독립성 : 응용 프로그램과 데이터베이스를 독립시킴으로써 데이터의 논리적 구조를 변경시키더라도 응용 프로그램은 변경되지 않는 특징
- 물리적 독립성 : 응용 프로그램과 보조기억장치와 같은 물리적 장치를 독립시킴으로써, 데이터베이스 관리 시스템의 성능 향상을 위해 새로운 디스크를 도입하더라도 응용 프로그램에는 영향을 주지 않고 데이터의 물리적 구조만 변경될 수 있는 특징.
스키마
- 데이터베이스의 구조와 제약 조건에 관한 전반적인 명세를 의미
- 개체, 속성, 관계 및 데이터 조작 시 데이터 값들이 갖는 제약 조건 등에 관해 전반적으로 정의.
- 외부(External Schema), 개념(Conception), 내부(Internal) 스키마로 나뉨
- 데이터 사전에 저장됨.
- 시간에 따라 불변의 특성을 가짐.
Data Dictionary
- 데이터 사전은 데이터베이스에 저장되어 잇는 모든 데이터 개체들에 대한 정보를 유지, 관리하는 시스템으로 시스템 카탈로그라고도 함.
- 데이터 사전에는 데이터에 관한 데이터가 저장되어 있다고 하여 메타 데이터라고도 함
Meta Data
- 실제 저장되는 데이터는 아니지만, 저장되는 데이터와 직접 혹은 간접적으로 관계가 있는 정보를 제공하는 데이터
MARC |
목록 레코드를 식별하여 축적, 유통할 수 있도록 코드화한 메타데이터 |
DC |
네트워크 환경에서 각종 전자 정보를 기술하는 메타 데이터 |
ONIX |
유통에 관한 통계와 체게적인 정보를 취급함으로써 정상적인 유통 및 관리를 위한 메타 데이터 |
MODS |
디른 도서관의 범용 서지 정보 표준 메타 데이터로서 MARC, DC, ONIX등을 절충하여 상호운용성과 정밀성을 모두 만족시킴 |
MDR(Meta Data Registry) : 메타 데이터의 등록과 인증을 통하여 메타 데이터를 유지 . 관리하며, 메타 데이터의 명세를 공유하는 레지스트리
데이터베이스 설계
- 데이터베이스 스키마를 개발하는 과정
- 요구 조건 분석 -> 개념적 설계 논리적 -> 논리적 설계 -> 물리적 설계 -> 데이터 베이스 구현 순으로 이루어짐
- Requirement Analysis -> Conceptual Design -> Logical Design -> Pysical Design -> Database Implementation
관계형 데이터 모델
관계형 데이터 구조 : 릴레이션
- 관계형 데이터 모델에서 데이터를 원자 값으로 갖는 이차원 테이블로 표현하는데, 이를 릴레이션이라 한다.
- 물리적인 저장 구조가 아니라 논리적인 저장 구조
- 열(Column)을 속성(attribute), 행(Row) 튜플이라고 함.
- 원자(Atomic)값들의 집합을 도메인 이라고 함
- 자료 저장의 형태가 2차원 구조의 표 또는 테이블로 표현됨.
ER모델을 관계형 데이터 모델로 변환
- 개념적 데이터 모델인 E-R 모델을 논리적 모델인 릴레이션 스키마로 변환하는 것으로, 매핑 룰(Mapping Rule)이라고도 한다.
릴레이션 스키마의 다른 표현
기호 |
의미 |
| |
필수(Mandatory) |
○ |
선택적(Optional) |
< |
다중(Multiple) |
관계 |
표현 |
1:1 |
┼──┼ |
1:0 또는 1:1 |
┼──0┼ |
1:N |
┼──<- |
1:1 또는 1:N |
┼──│<- |
1:0 또는 1:1 또는 1:N |
┼──0│<- |
식별관계(Identifying) : A의 기본키가 B의 외래키 이면서 동시에 기본키인것.
비식별관계(Non-Identifying) : A의 기본키를 B가 참조하지만 기본키가 아닌것.
키의 개념 및 종류
슈퍼키(Super Key)
- 한 릴레이션 내에 있는 속성들의 집합으로 구성된 키
- 릴레이션 구성하는 모든 튜플 중 슈퍼키로 구성된 속성의 집합과 동일한 값을 나타내지 않음.
- 유일성(Unique)은 만족하지만, 최소성(Minimality)는 만족하지 못함.
후보키(Candidate Key)
- 릴레이션을 구성하는 속성들 중에서 튜플을 유일하게 식별하기 위해 사용되는 속성들의 부분 집합
- 유일성 최소성을 모두 만족함.
- 2개 이상의 필드를 조합하여 만든 키를 복합키(Composite Key)라고 한다.
기본키(Primary Key)
- 후보키 중에서 특별히 선정된 키로 중복된 값을 가질 수 없음.
- 유일성과 최소성을 가지며 튜플을 식별하기 위해 반드시 필요한 키. (후보키의 성질을 가짐)
- 기본키는 NULL값을 가질 수 없다.
대체키(Alternate Key)
- 대체키는 후보키 중에서 선정된 기본키를 제외한 나머지 후보키를 의미함.
외래키(Foreign Key)
- 다른 릴레이션의 기본키를 참조하는 속성 또는 속성들의 집합
- 릴레이션의 관게를 표현할 때 사용.
- 외래키는 참조 릴레이션의 기본키와 동일한 속성을 가진다.
무결성(Integrity)
- 데이터베이스에 저장된 데이터 값과 그것이 표현하는 현실 세계의 실제 값이 일치하는 정확성을 의미
- 무결성 제약 조건(Constraint)은 데이터베이스에 저장된 데이터의 정확성을 보장하기 위해 정확하지 않은 데이터가 데이터베이스 내에 저장되는 것을 방지하기 위한 제약 조건을 말한다.
NULL 무결성
- 릴레이션의 특정 속성 값이 NULL이 될 수 없도록 하는 규정
고유(Unique)무결성
- 릴레이션의 특정 속성에 대해 각 튜플이 갖는 속성 값들이 서로 달라야 한다는 규정.
도메인 무결성
- 특정 속성의 값이 그 속성이 정의된 도메인에 속한 값이어야 한다는 규정
키 무결성
- 하나의 릴레이션에는 적어도 하나의 키가 존재해야 한다는 규정
관계 무결성
- 릴레이션에 어느 한 튜플의 삽입 가능 여부 또는 한 릴레이션과 다른 릴레이션의 튜플들 사이의 관계에 대한 적절성 여부를 지정한 규정
참조 무결성
- 외래키 값은 NULL이거나 참조 릴레이션의 기본키 값과 동일해야 한다는 규정
개체 무결성
- 기본 릴레이션의 기본키를 구성하는 어떤 속성도 NULL 일 수 없다는 규정
관계대수
- 관계대수는 관계형 데이터베이스에서 원하는 정보와 그 정보를 어떻게 유도하는가를 기술하는 절차적 언어
- 기본 연산인 SELECT, PROJECT, JOIN, DIVISION 등과 집합 연산인 UNION, DIFFERENCE, INTERSECTION, CARTESIAN, PRODUCT등이 있다.
SELECT
- 릴레이션에 존재하는 튜플들 중에서 특정 조건을 만족하는 튜플들의 부분집합을 구하여 새로운 릴레이션을 만듬
- 릴레이션의 행에 해당하는 튜플을 구하는 것이므로 수평 연산이라고도 함.
- 연산자 기호는 그리스 문자 시그마(σ)임.
- σ<조건>R 로 표현함 R은 릴레이션
PROJECT
- 주어진 릴레이션 속성 리스트에 제시된 속성 값만을 추출하여 새로운 릴레이션을 만듬.(중복은 제거됨)
- 릴레이션의 열에 해당하는 속성을 추출하는 것으로 수직 안산이라고도 함.
- 그리스 문자 파이(π)를 사용함.
- π<속성 리스트>R 로 표현함 R은 릴레이션
JOIN
- 두개의 릴레이션을 하나로 합쳐서 새로운 릴레이션을 만듬.
- Join으로 만들어진 릴레이션의 차수는 조인된 두일레이션의 차수를 합한 것과 같다.
- JOIN연산의 결과는 CARTESIAN PRODUCT연산을 수행한 다음 SELECT연산을 수행한 것과 같다.
*CARTESIAN PRODUCT : 두 릴레이션에 존재하는 모든 튜플들을 대응시켜 새로운 릴레이션을 만드는 연산으로,
연산의 결과 차수는 두 릴레이션의 차수를 합한 것과 같고 튜플은 두 릴레이션의 튜플 수를 곱한 것과 같다.
- θ(Theta)로 표현될 수 있는 조인을 세타 조인(Theta)
- Join조건이 =일때 동일한 속성이 2번 나타나게 되는데, 이 중 중복을 제거하여 같은 속성은 1번만 나타나게 하는 연산을 자연 조인(Natural join)이라 한다.
관계해석
- 관계 데이터 모델 제안자인 코드(E. F. Codd)가 수학의 Predicate Calculus(술어해석)에 기반을 두고 관계 데이터베이스를 위해 제안함.
- 관계 데이터의 연산을 표기하는 방법으로, 원하는 정보를 정의 할 때는 계산 수식을 사용함
- 원하는 정보가 무엇이라는 것만 정의하는 비절차적 특성을 지님.
- 튜플 관계해석과 도메인 관계해석이 있음.
- 관계해석과 관계대수는 관계데이터베이스를 처리하는 기능과 능력 면에서 동등하며, 관계대수로 표현한 식은 관계해석으로 표현할 수 있다.
- 질의어로 표현
'정보처리기사 실기 > 데이터베이스' 카테고리의 다른 글
SQL - DCL (0) | 2018.09.12 |
---|---|
SQL - DML (0) | 2018.09.12 |
SQL - JOIN (0) | 2018.09.12 |
SQL - SELECT (0) | 2018.09.12 |
SQL - DDL (0) | 2018.09.12 |