1) 데이터베이스 종류 및 선정
1) 데이터베이스
1) 데이터베이스 개념
데이터베이스는 다수의 인원, 시스템 또는 프로그램이 사용할 목적으로 통합하여 관리되는 데이터의 집합이다.
IT 시스템의 발달로 인해 급증하는 데이터에 대한 효과적인 관리가 중요해졌으며 자료의 중복성 제거, 무결성 확보, 일관성 유지, 유용성 보장은 데이터베이스 관리의 핵심이다.
① 데이터베이스의 특징
- 실시간 접근성(Real-time Accessibility)
- 계속적인 변화(Continuous Evolution)
- 동시 공유(Concurrent Sharing)
- 내용에 의한 참조(Content Reference)
② 데이터베이스 설계 순서
요구조건 분석 -> 개념적 설계 -> 논리적 설계 -> 물리적 설계 -> 구현
2) 데이터베이스 용어
속성(Attribute) : 릴레이션 내의 하나의 열을 의미하며, 어떤 개체(Entity)를 표현하고 저장한 것으로 흔히 컬럼(Column) 또는 필드(Filed)로 표현하기도 한다.
튜플(Tuple) : 릴레이션 내의 하나의 행을 의미하며, 레코드(Record) 또는 로우(Row)로 표현하기도 한다.
차수 (Degree) : 하나의 릴레이션 안에 들어있는 속성의 수를 의미한다.
기수(Cardinality) : 하나의 릴레이션 내에 들어있는 튜플의 수를 의미한다.
도메인(Domain) : 릴레이션 내 각각의 속성들이 가질 수 있는 값들의 집합을 의미한다.
뷰(View) : 하나 이상의 기본 테이블로부터 유도된 가상의 테이블, 구조와 조작도 기본 테이블과 매우 유사하다.
트랜잭션(Transection) : 데이터베이스 내에서 하나의 작업 수행을 위한 연산들의 집합을 의미한다.
- ACID(트랜잭션의 안정성)
- 원자성(Atolicity)
- 일관성(Consistency)
- 독립성(Isolation)
- 지속성(Durabillity)
스키마(Schema) : 데이터베이스의 구조와 제약조건에 관한 전반적인 명세를 의미한다.
| 내부 스키마(물리) | 시스템 프로그래머나 설계자의 관점에서 정의하는 데이터베이스 |
| 개념 스키마(논리) | 사용자들이 필요로 하는 데이터를 기관이나 조직의 관점에서 정의한 데이터베이스 |
| 외부 스키마(서브) | 사용자 등의 개인적 입장에서 필요로 하는 데이터베이스 |
키(Key) : 무언가를 식별하는 고유한 식별자(Identifier) 기능을 하는 것이다.
- 후보키(Candidate Key) : 유일성과 최소성을 만족하는 속성들의 집합
- 기본키(Primary Key) : 후보키 중 선정된 키로 중복값 입력이 불가능하고, Null 값을 가질 수 없음
- 슈퍼키(Super Key) : 유일성 만족, 최소성 불만족하는 속성들의 집합
- 대체키(Alternate Key) : 후보키 중 기본키로 선택되지 못한 후보키들
- 외래키(Foreign Key) : 다른 테이블의 행을 식별하는 키
3) 데이터베이스 관리 시스템(DBMS, Database Management System)
위와 같은 데이터 관리의 복잡성을 해결하는 동시에 데이터 추가, 변경, 검색, 삭제 및 백업, 복구, 보안 등의 기능을 지원하는 소프트웨어이다.
저장되는 정보는 텍스트, 이미지, 음악 파일, 지도 데이터 등으로 매우 다양하며, SNS의 발달과 빅데이터의 폭넓은 활용으로 인해 데이터의 종류와 양이 급격히 증가하는 추세이다.
DBMS의 장단점
| 장점 | 데이터 중복 최소화 데이터 공유(일관성 유지) 정합성, 부결성, 보안성 유지 사용자 중심의 데이터 처리 데이터 표준화 적용 가능 데이터 접근 용이 데이터 저장 공간 공유로 인한 절약 |
| 단점 | 데이터베이스 전문가(DBA) 필요 DBMS 구축 서버 필요 및 유지비 데이터 백업과 복구 어려움 시스텝의 복잡성 대용량 디스크로 엑세스 집중 시 병목 현상으로 과부화 발생 대용량 데이터 처리가 어려움 |
4) 데이터베이스 관리자(DBA, Database Administrator)
데이터베이스를 직접 활용하기보다는 사용자를 위해 데이터베이스를 설계 및 구축하고, 제대로 서비스할 수 있도록 데이터베이스를 관리하고 제어한다.
데이터베이스 관리자의 주요 업무
- 데이터베이스 구성요소 선정
- 데이터베이스 스키마 정의
- 물리적 저장 구조와 접근 방법 결정
- 무결성 유지를 위한 제약조건 정의
- 보안 및 접근 권한 정책 결정
- 백업 및 회복 기법 정의
- 시스템 데이터베이스 관리
- 시스템 성능 감시 및 성능 분석
- 데이터베이스 재구성
2) 데이터베이스 종류
1) 파일시스템
파일에 이름을 부여하고 저장이나 검색을 위하여 논리적으로 그것들을 어디에 위치시켜야 하는지 등을 정의한 뒤 관리하는 데이터베이스 전 단계의 데이터 관리 방식이다.
| ISAM(Indexed Sequential Access Method) | 자료 내용은 주 저장부, 자료의 색인은 자료가 기록된 위치와 함께 색인부에 기록 되는 시스템 |
| VSAM(Virtual Storage Access Method) | 대형 운영 체계에서 사용되는 파일 관리 시스템 |
2) 계층형 데이터베이스 관리 시스템(HDBMS, Hierarchical Database Management System)
데이터를 상하 종속적인 관계로 계층화하여 관리하는 데이터베이스이다.
데이터에 대한 접근 속도가 빠르지만, 종속적인 구조로 인하여 변화하는 데이터 구조에 유연하게 대응하기가 쉽지 않다.
IMS, System 2000과 같은 제품이 있다.
3) 망형 데이터베이스 관리 시스템(NDBMS, Network Database Management System)
데이터의 구조를 네트워크 상의 망형 형태로 논리적으로 표현한 데이터 모델이다.
트리 구조나 계층형 데이터베이스보다는 유연하지만 설계가 복잡하다는 단점이 있다.
IDS, TOTAL, IDMS와 같은 제품이 있다.
4) 관계형 데이터베이스 (RDBMS, Relational Database Management System)
가장 보편화 된 데이터베이스 관리 시스템이다.
데이터를 저장하는 테이블의 일부를 다른 테이블과 상하 관계로 표시하며 상관 관계를 정리한다.
변화하는 업무나 데이터 구조에 대한 유연성이 좋아 유지 관리가 용이하다.
| Oracle | 미국 오라클사에서 개발한 데이터베이스 관리 시스템으로 유료이다. 리눅스, 유닉스, 윈도우 모두를 지원하며 대형 시스템에서 많이 사용한다. |
| SQL Server | 마이크로소프트사에서 개발한 관계형 데이터베이스 시스템이다. 마이크로소프트사 제품이기 때문에 windows 서버에서만 구동이 되며, 마이크로소프트사의 개발 언어인 C#등과 가장 잘 호환된다. |
| MySQL | 썬 마이크로시스템에서 소유했던 관계형 데이터베이스 시스템이었으나 오라클에서 인수하였다. 리눅스, 유닉스, 윈도우에서 모두 사용이 가능하고 오픈소스 기반으로 개발되었다. |
| Maria DB | MySQL 출신 개발자가 만든 데이터베이스이다. MySQL과 완벽히 호환된다. |
5) NoSQL(Not Only SQL)
전통적인 관계형 데이터베이스보다 덜 제한적인 일관성 모델을 이용하고, 빅데이터와 실시간 웹 어플리케이션의 상업적 이용에 쓰인다.
3) 데이터베이스 관리 시스템(DBMS)의 특징
| 데이터 무결성 | 부적절한 자료가 입력되어 동일한 내용에 대하여 서로 다른 데이터가 저장되는 것을 허용하지 않는 성질 |
| 데이터 일관성 | 삽입, 삭제, 갱신, 생성 후에도 저장된 데이터가 변함없이 일정해야 하는 성질 |
| 데이터 회복성 | 장애가 발생하였을 시 특정 상태로 복구되어야 하는 성질 |
| 데이터 보안성 | 불법적인 노출, 변경, 손실로부터 보호되어야 하는 성질 |
| 데이터 효율성 | 응답 시간, 저장 공간 활용 등이 최적화 되어 사용자, 소프트웨어, 시스템 등의 요구 조건을 만족시켜야 하는 성질 |
4) 데이터베이스 관리 시스템 분류
1) 시스템 특징별 분류
관리하는 데이터의 형태 및 관리 방식에 따라 구분할 수 있다.
관계형 데이터베이스, 문서 저장 시스템, 그래프 데이터베이스, Key-Value 스토어 등으로 구분된다.
| 관계형 DBMS (Relational DBMS) |
테이블의 구조(스키마)를 정의하고 테이블 간의 관계를 정의하여 데이터 관리 가장 광범위하게 쓰이는 DBMS 비관계형 부분까지 확장하여 관리 범위를 넓힌 형태의 관계형 DBMS 출시 ex) Oracle, MySQL, MS SQL Server, Maria DB, PostgreSQL, DB2 |
| 문서 저장 DBMS (Document Store DBMS) |
관계형 DBMS와는 달리 스키마 구조가 필요 없음 일관된 구조가 필요 없음 컬럼은 하나 이상의 값을 가질 수 있음 Client에서 후처리 필요 ex) Mongo DB, Amazon Dynamo DB, Couchbase, MS Azur cosmos DB |
| 그래프 DBMS (Graph DBMS) |
노드와 에지로 특징되는 요소 특화 노드 간 관계를 구조화하여 저장 ex) Neo4j, MS Azur cosmos DB, Orient DB, Arango DB |
| 키값 DBMS (Key-Value DBMS) |
가장 간단한 형태의 DBMS 임베디드 시스템과 같은 간단한 시스템에 적합 ex) Redis, Amazon Dynamo DB, Memcached |
2) 상용화 및 오픈소스 기반 분류
| 상용화 DBMS | 상업적 목적으로나, 판매를 목적으로 생성되는 소프트웨어 ex) Oracle, MS SQL Server, DB2, Microsoft Access, Teradata |
| 오픈소스 기반 DBMS | 누구에게나 공개해 누구나 제한 없이 사용할 수 있는 소프트웨어 ex) MySQL, PostgreSQL, Mongo DB, Redis, Elasicsearch |
2) 관계형 데이터베이스 활용
1) 개체 - 관계 다이어그램(ERD, E - R Diagram)
1) ERD 개요
ERD는 업무 분석 결과로 도출된 실체(Entity)와 엔티티 간의 관계를 도식화 한 것이다.
ERD는 요소들 간 연관성을 도식화 하기 때문에 데이터베이스 관리자, 개발자, 사용자 모두 데이터의 흐름과 연관성을 공통적으로쉽게 확인할 수 있다.
2) E - R 모델(E - R Model)
ERD의 구성요소인 개체, 관계, 속성을 추출하기 위해서느 업무나 시스템에 대한 명확한 정의가 있어야 한다.
ERD로 도식화하기 전 각 개체를 사각형, 화살표, 마름모로 표기한 형태를 E - R 모델이라고 한다.
ex) 업무에 대한 개체, 관계, 속성 추출
| 업무 | 각각의 종업원은 한 매장에 소속된다. 종업원에 관해서는 사번, 이름, 주소, 휴대전화번호의 정보를 관리한다. 매장에 대해서는 매장 코드, 매장명, 매장 전화번호, 매장 주소 정보가 유지된다. |
| 개체, 관계, 속성 | 개체 : 종업원, 매장 관계 : 소속 속성 : 사번, 이름, 주소, 휴대전화번호, 매장 코드, 매장명, 매장 전화번호, 매장 주소 |
① 엔티티(Entity)
사물 또는 사건을 의미하며, 개체라고도 한다.
ERD에서 엔티티는 사각형으로 나타내고 사각형 안에는 엔티티의 이름을 넣는다.
- 엔티티 이름은 가능한 대문자로 쓰며 단수형으로 명명한다.
- 유일한 단어로 정한다.
② 속성(Attribute)
엔티티가 가지고 있는 요소 또는 성질을 의미한다.
속성은 선으로 연결된 동그라미로 표기하거나 표 형식으로 표기한다.
관계형 데이터베이스 활용을 위해서는 표 형식으로 표기하는 것이 더 편리하다.
- 속성명은 단수형으로 명명한다.
- 엔티티며을 사용하지 않는다.
- 속성이 필수 사항(Not Null)인지, 필수 사항이 아닌지(Null)를 고려하여 작성한다.
③ 관계(Relationship)
두 엔티티 간의 관계를 정의한다.
개체는 사각형, 속성은 타원형을 이용하여 표시한다.
ERD 관계 표식 및 의미

3) 데이터베이스 관리
1) 데이터베이스 연산
CRUD는 데이터베이스가 가지는 기본적인 데이터 처리 기능인 Create(생성), Read(읽기), Update(갱신), Delete(삭제)를 말한다.
| 기본 처리 | SQL | 설명 |
| Create | Insert | 테이블 내 컬럼에 값을 추가한다. |
| Read | Select | 테이블 내 컬럼에 저장된 데이터를 불러온다. |
| Update | Update | 테이블 내 컬럼에 저장된 데이터를 수정한다. |
| Delete | Delete | 테이블 내 컬럼에 저장된 데이터를 삭제한다. |
2) 데이터베이스 연산 수행 절차
1) 데이터 삽입
테이블에서 데이터를 읽기 위해서는 "Insert" 명령어를 사용한다.
INSERT INTO table_name VALUES(value1, value2, value3, ...);
2) 데이터 읽기
테이블에서 데이터를 읽기 위해서는 "Select" 명령어를 사용한다.
Select 다음 * 표시를 사용하면 모든 데이터를 읽어오고, 컬럼명을 지정하면 특정 컬럼만 읽어온다.
SELECT column1, cloumn2, ... FROM table_name;
3) 데이터 갱신
테이블에서 데이터를 갱신하기 위해서는 "Update" 명령어를 사용한다.
where 조건절을 사용하여 업데이트 할 데이터를 특정해야 한다.
UPDATE table_name
SET column1 = value1, column2 = value2, ...
WHERE condition;
4) 데이터 삭제
테이블에서 데이터를 삭제하기 위해서는 "Delete" 명령어를 사용한다.
where 조건절을 사용하여 삭제하 데이터를 특정해야 한다.
DELETE FROM table_name
WHERE condition;
5) 기타 SQL 명령어
ALTER DATABASE 명령어를 사용하여 데이터베이스를 수정한다.
ALTER TABLE 명령어를 사용하여 테이블 구조를 수정한다.
DROP TABLE 명령어를 사용하여 테이블을 전체 삭제한다.
CREATE INDEX 명령어를 사용하여 테이블 내 데이터의 검색 속도를 향상시킬 수 있는 인덱스를 생성한다.
DROP INDEX 명령어를 사용하여 인덱스를 삭제한다.
JOINT 기능을 사용하여 복수의 테이블로부터 데이터를 조합하여 가져온다.
그 외에도 UNION, GROUP BY 등의 다양한 명령어를 활용한다.