데이터 분석 과정
- 데이터 수집 → 데이터 전처리 → 모델링 → 평가 및 배포
- 데이터 수집
- 외부 데이터(정형/반정형/비정형)
- 내부 데이터
- DBMS = orcle , mysql 과 같은 database를 관리할 수 있는 system
- RDBMS가 가장 효율적이라는 이론이 밝혀짐
- 정형화된 데이터를 다룸
- DBMS = orcle , mysql 과 같은 database를 관리할 수 있는 system
database = 하나의 컴퓨터안에 저장될 수 없는 큰 데이터를 다루는 범주
자료구조 = 하나의 application 단위에서 수행하는데 필요로 하는 데이터 용량(범위)를 다루는 범주
RDBMS 제품군
- Oracle, MySQL, MSSQL…
네트워크
: 두 대상간의 데이터 교환
- DB를 구현 후 클라이언트와 연결하는 과정에 필요
- 프로토콜 = 네트워크를 통해 데이터가 교환되려면 쌍방간의 규약을 지켜야 한다.
- Oracle 프로토콜 = TCP/IP를 사용하기로 함.
- DB client 역시 오라클 서버에 원하는 데이터 처리를 하려면 TCP/IP 규약에 맞춰 데이터 전송을 해야한다.
- tcp/ip 규약은 정확한 전송을 위해 데이터 전송전에 Connection을 통해 통신가능 여부를 확인 후, 데이터 전송이 이루어진다.
Oracle Database SE = 전역데이터
- 데이터에 이상이 발생하면 데이터 무결성이 지켜질 수 없음.
- Structed 된 정보는(스키마 때문에 발생) 데이터를 안정화 시키지만 여러 데이터베이스에 나누어 저장되어 있던 데이터를 합치는 빅데이터의 경우 Structed된 정보가 좋지 않다. 그래서 NoSQL 같은 Structed 되지 않은 DBMS이 사용된다.
'Back > DataBase이론' 카테고리의 다른 글
4장 SQL 고급 (0) | 2023.03.27 |
---|---|
3장 SQL 기초 (0) | 2023.03.23 |
2장 관계형 데이터베이스 - 2 (0) | 2023.03.23 |
2장 관계 데이터 모델 -1 (0) | 2023.03.23 |
1장 데이터베이스 시스템 (0) | 2023.03.22 |