목록분류 전체보기 (104)
juuuding

💡Machine Learning Overview - 기계 학습의 2가지 주요 유형: supervised / unsupervised (지도/비지도) Supervised Learning * Supervised learning: 모델이 올바른 입력, 출력 쌍을 가지고 학습한 후, 이 전에 본 적 없는 새로운 입력 x를 입력 받아 적절한 출력 값 y를 생성하는 것을 시도할 수 있다. 학습 알고리즘 예제를 제공한다. [Regression] - 무한히 많은 가능한 output들로 수를 예측한다. ex) Housing price prediction [Classification] - 적은 가능한 output들로 범주를 예측한다. ex) Breast cancer detection + classfication과 regre..
회복 1. 회복의 필요성 - 어떤 트랜잭션 T를 수행하는 도중에 시스템이 다운되었을 때, T의 수행 효과가 디스크의 데이터베이스 일부 반영되었을 수 있음 * 어떻게 T의 수행을 취소하여 원자성을 보장할 것인가? - 또한 트랜잭션 T가 완료된 직후에 시스템이 다운되면 T의 모든 갱신 효과가 주기억 장치로부터 디스크에 기록되지 않았을 수 있음 * 어떻게 T의 수행 결과가 데이터베이스에 완전하게 반영되도록 하여 지속성을 보장할 것인가? - 디스크의 헤드 등이 고장 나서 디스크의 데이터베이스를 접근할 수 없다면 어떻게 할 것인가? 2. 회복의 개요 - 여러 응용이 주기억 장치 버퍼 내의 동일한 데이터베이스 항목을 갱신한 후에 디스크에 기록함으로써 성능을 향상시키는 것이 중요함 - 버퍼의 내용을 디스크에 기록하는..
■ 트랜잭션 (transaction) - 데이터베이스를 수천명 이상의 사용자들이 동시에 접근 - 많은 사용자들이 서로 다른 부분, 같은 부분을 접근하면서 데이터베이스를 사용 - 동시성 제어 (concurrency control) √ 동시에 수행되는 트랜잭션들이 데이터베이스에 미치는 영향은 이들을 순차적으로 수행하였을 때 데이터베이스에 미치는 영향과 같도록 보장 √ 다수 사용자가 데이터베이스를 동시에 접근하도록 허용하면서 데이터베이스의 일관성을 유지함 - 회복 (recovery) √ 데이터베이스를 갱신하는 도중에 시스템이 고장 나도 데이터베이스의 일관성을 유지 트랜잭션 개요 * 두개의 UPDATE문을 수행하여할 때, 첫 UPDATE문을 수행한 후 두 번째 UPDATE문을 수행하기 전에 컴퓨터 시스템이 다운..

* 이번 ch는 장거리 통신에 대해 공부한다. 장거리 통신인 WAN은 소유주가 많기 때문에 traffic의 예측이 불가능하고 그렇기 때문에 provisioning을 정확히 할 수 없기 때문에 느리다. 또, 예측이 불가능하기 때문에 높은 transmission rate을 사용한다. [Station, Node, Communication network & Path] (1) Stations - End devices (컴퓨터, 터미널, 폰...) - host, end node : 맨 끝에 존재하며 L1~L5를 모두 가지고 있음 (data를 생성해서 보내고 싶거나, data를 받고 싶은 주체) (2) Nodes - 중간 네트워크 장비라는 뜻으로 사용 -> Intermediate node, network, excha..

제1정규형, 제2정규형, 제3정규형, BCNF 1. 제 1 정규형 - 한 릴레이션 R이 제 1정규형을 만족할 필요충분조건: R의 모든 애트리뷰트가 원자값만을 가짐 - 릴레이션의 모든 애트리뷰트에 반복 그룹이 나타나지 않으면 제1정규형 만족 - 제1정규형을 만족하지 않을 때 제1정규형으로 변환해주기 + 애트리뷰트의 집합에 속한 각 값마다 하나의 투플로 표현 + 모든 반복 그룹 애트리뷰트를 분리해서 새로운 릴레이션에 넣기. 그리고 원래 릴레이션의 기본키를 새로운 릴레이션에 애트리뷰트로 추가함 1-2. 제1정규형에 존재하는 갱신 이상 - 위 그림의 학생 릴레이션은 모든 애트리뷰트가 원자값을 가지므로 제1정규형 만족 - 이 릴레이션의 기본 키는 (학번, 과목번호) 1-3. 삭제 이상 - 어떤 학과에 소속된 마지..
■ 릴레이션 정규화 - 부주의한 데이터베이스 설계는 제어할 수 없는 데이터 중복을 야기하여 여러 가지 갱신 이상을 유발함 - 어떻게 좋은 데이터베이스 설계를 할 것인가? 데이터베이스에 어떤 릴레이션들을 생성할 것인가? 각 릴레이션에 어떤 애트리뷰트들을 둘 것인가? - 정규화는 주어진 릴레이션 스키마를 함수적 종속성과 기본키를 기반으로 분석하여, 원래의 릴레이션을 분해함으로써 중복과 세가지 갱신 이상을 최소화함 정규화 개요 1. 좋은 관계 데이터베이스 스키마를 설계하는 목적 - 정보의 중복과 갱신 이상이 생기지 않도록 하고, 정보의 손실을 막으며, 실세계를 잘 나타내고, 애트리뷰트 간의 관계가 잘 표현되게 보장하고, 어떤 무결성 제약조건의 시행을 간단하게 하며, 효율성 측면도 고려 - 우선 갱신 이상이 발..

단일 단계 인덱스 1. 단일 단계 인덱스(인덱스된 순차 화일) - 인덱스된 순차 화일은 인덱스를 통해서 임의의 레코드를 접근할 수 있는 화일 - 단일 단계 인덱스의 각 엔트리는 - 엔트리들은 탐색 키 값의 오름차순으로 정렬됨 - 인덱스는 데이터 화일과는 별도의 화일에 저장됨 - 인덱스의 크기는 데이터 화일의 크기에 비해 훨씬 작음 - 하나의 화일에 여러 개의 인덱스들을 정의할 수 있음 - 인덱스가 정의된 필드를 탐색 키라고 부름 - 탐색 키의 값들은 후보 키처럼 각 투플마다 반드시 고유하지는 않음 - 키를 구성하는 애트리뷰트뿐만 아니라 어떤 애트리뷰트도 탐색 키로 사용될 수 있음 - 인덱스의 엔트리들은 탐색 키 값의 오름차순으로 저장되어 있으므로 이진 탐색을 이용할 수도 있음 2. 기본 인덱스 (prim..

■ 물리적 데이터 베이스 설계 - 논리적인 설계의 데이터 구조를 보조 기억 장치 상의 화일(물리적 데이터 모델)로 사상함 - 예상 빈도를 포함하여 데이터베이스 질의와 트랜잭션들을 분석함 - 데이터에 대한 효율적인 접근을 제공하기 위하여 저장 구조와 접근 방법들을 다룸 - 특정 DBMS의 특성을 고려하여 진행됨 - 질의를 효율적으로 지원하기 위해서 인덱스 구조를 적절히 사용함 보조 기억 장치 1. 보조 기억 장치 - 원하는 데이터를 검색하기 위해 DBMS는 디스크 상의 데이터베이스로부터 원하는 데이터를 포함하는 블록을 읽어서 주기억 장치로 가져옴 - 데이터가 변경된 경우 블록들을 다시 디스크에 기록함 - 블록의 크기는 512B ~ , 전형적인 블록의 크기는 4096B = 4KB - 각 화일은 고정된 크기의..