no image
6. Indexing Structures for Files and Physical Database Design
Index는 보통 자주 접근하는 파일들의 데이터 접근 속도를 높이기 위해 사용한다. 대부분의 index는 ordered files에 대해 구현되어 있다. 주로 Tree 구조를 사용한다. Types of Index Primary Index Clustering Index Secondary Index Ordering field에 대한 index Key 값의 중복이 없다. Ordering field에 대한 index Key 값의 중복이 가능하다. Non-ordering field에 대한 index 자주 검색되는 attribute를 index로 사용 Primary Index Primary Key, K(i) + Pointer to disk block, P(i) Primary Key는 주로 PK를 사용하지만, 다른 ..
2023.05.02
no image
5. Basic SQL
SQL은 선언적인 언어로 매우 쉽다. 외국에서는 "SEQUEL"이라고 한다. 앞에서 배웠던 tabe, row, column으로 이루어져 있다. SQL schema CREATE SCHEMA COMPANY(이름) AUTHORIZATION 'Ushin'; Schema name과 각 element에 대한 권한, 설명을 함께 표기한다. Catalog Schema는 여러개일 수 있다. Schema들의 이름을 모아둔 것을 catalog라고 한다. CREATE TABLE CREATE TABLE COMPANY.EMPLOYEE or CREATE TABLE EMPLOYEE Table도 만들 수 있다. 이런 table들을 필요에 맞게 view의 형태로 보여줄 수 있다. 실제로 table을 만들어서 물리적으로 저장하는 것이 아..
2023.05.02
no image
4. The Relational Data Model & Relational Database Constraints
Informal Definitions Relation은 table처럼 보인다. 각 row 줄을 tuple이라고 한다. Entity와 같은 개념이라고 보면 된다. Tuple이 가지는 attributes 중 유니크하게 구별해주는 attribute를 key라고 한다. 위의 예시에서는 SSN이 Key가 된다. Formal Definitions - Schema R(A1, A2, ..., An) Relation은 위와 같이 표현한다. R은 relation의 이름이고, An은 attribute의 이름이다. 각 attribute가 가질 수 있는 value의 범위를 domain이라고 한다. Formal Definitions - Tuple Tuple은 value의 ordered set으로 보통 표시한다. 3-tuples라..
2023.05.02
no image
3.Data Modeling Using the Entity-Relationship(ER) Model
Overview of DB Design Process 요구사항을 잘 파악해서 디자인하는 것이 중요하다. ER Model Concepts Entity Attribute Relationships 객체 속성, Entity type이라고도 한다. Entity간의 관계 Entity type Attribute type Relationship type 객체에 해당하는 attribute를 규격화한 정보이다. Attribute의 속성을 규격화한 것이다. Entity-entity에 대한 정보를 말한다 Entity는 "Employee", "Project" 등이고 Attribute는 "Project"의 title, member, due-date 등이다. Types of Attributes Simple Composite Mul..
2023.05.02
no image
2. Database System Concepts and Architecture
Data Model Data 추상화를 위한 도구이다. 다음의 내용이 포함된다. Structure of DB Elements and Data types Entity, Record, Table Relationships Operation for manipulating basic model operations user-defined operations Constraints Valid data에 대한 제약 Categories of Data Models Conceptual Physical Implementation Self-Describing Entity-based, Object-based라고도 불린다. 사람이 이해할 수 있는 data model이다. 컴퓨터가 이해하기 쉬운 모델이다. 어디다 저장할지 등의 정보가 ..
2023.05.02
no image
1. Databases and Users
Basic Definitions Data 정보 Database 정보의 집합 Mini-world 정보가 나타내는 세계, 가지고 있는 정보로 알 수 있는 것들 Entity in Mini-world Mini-world에서의 attributes ex) Mini-world = UNI Entity1: STUDENT Entity2: COURSE Entity3: SECTION Entity4: INSTRUCTORs Relationship Entity-Relationships(ER): Entity간의 관계 UML class model Database Management System 컴퓨터로 저장된 정보를 관리하는 소프트웨어 Database System DBMS+DB Simplified Architecture for a D..
2023.05.02
no image
3. Attention, Transformer, Deep Generative Model, Variational Autoencoder, Generative Adversarial Network, Self-supervised Learning, Reinforcement Learning
Attention for CNN&RNN 1. Seq2seq Sentence를 Input으로 받아서 sentence를 output으로 가지는 model이다. Encoder RNN + Decoder RNN Encoder RNN의 마지막 hidden state를 Decoder의 Input hidden state로 사용한다. Decoder RNN: Loss function: \( J = {1 \over k} \sum J_{k} \) Backpropagation operated end-to-end 여기서 볼 수 있듯이, Encoder RNN은 sentence에 대한 정보를 하나의 hidden state에 녹여서 Decoder로 보내게 된다. Long sentence에서 불리하며, Information bottle..
2023.05.01
no image
2. ML overview, Visual Features for ML, Language Model & Word Embedding, Neural Network, Convolutional Neural Network, Recurrent Neural Network
기말고사를 대비하기 위한 글이다. ML overview 1. Types of learning Supervised Unsupervised (self-supervised) Discrete Classification Clustering Continuous Regression Dimensionality Reduction 2. Classification 대표적인 모델은 K-NN, Logistic regression, SVM이 있다. K-NN f(x) = laber of the nearest training data Logistic regression 모델 결과값에 따라 분류한다. SVM 2개 class 분류를 잘하는 hyper-plane을 찾는 모델이다. * hyper-plane : \( w^{T}x+b \) *..
2023.05.01
no image
1. Features for ML
딥러닝(DL)을 잘하고 싶다면, 기계학습(Machine Learning, ML)에 대한 이해가 깊으면 도움이 된다. 기본적으로는 ML의 네트워크에서 layer를 3개 이상 쌓은 것들을 DL이라고 하기 때문이다. 구체적으로는 ML에서 사람이 feature extraction을 손수 진행했던 반면, DL에서는 feature도 학습 과정에서 알아서 찾길 원한다는 차이점이 존재한다. DL이 가장 많이 쓰이는 분야는 이미지 인식과 언어 인식이다. 이미지 인식(Image Recognition)은 이미지에서 객체를 식별하는 것이 주된 목표이고 언어 인식(National Language Processing, NLP)은 문장에서의 단어들을 가지고 해석하는 것이 주된 목표이다. DL에서 무엇을 하는지 알기 위해, 이미지 ..
2023.05.01