목록대학원 수업 (77)
공부 정리 블로그

Estimator or filter 좁은 의미의 filter - 입력 신호가 있고 입력 신호에 대해서 각각의 샘플에 대해 weight를 줘서 곱하고 더해서 하나의 값의 출력을 만드는 것 넓은 의미의 Filter - 입력이 있고 출력이 있는 입출력 시스템 filter를 estimator로 filter란 noisy한 것에서 정보를 추출하기 위해서 디자인된 시스템 filter의 쓰임 Radar Communications Sonar Navigation Seismology Biomedical engineering Financial engineering (주가 예측_ 과거의 값을 예측하는 것은 의미가 없음) Others The Filtering Problem (2) baseband 를 moduelation (주파수..

Finite State Acceptor (FSA) input a, b인 경우만 accept, 그 외엔 accept X state 개수 유한함 Less trivial FSA accept : aa, aab, aaab, aa*b Epsilon symbol (ε) The symbol εmeans no symbol is there(non-deterministic) This example represents the set of strings {a, aa, aaa, . . .} If εwere treated as a normal symbol, this would be {a, aε a, aε aε a, …} Weighted finite state acceptor 얼마나 잘 accept하는지를 weight를 통해서 나타..

Difficulties of Decision Making - 어떤 카메라를 살지, 휴일을 어디서 보낼지, 무슨 영화를 빌릴지, 누구를 팔로우 할지, 재밌는 기사를 어디서 발견할 것인지,... 선택이 너무 많고 정보가 부족할 경우 선택이 어려움 -> 추천시스템으로 사용자에게 정보 제공 ex) 넷플릭스, 유튜브 알고리즘 Main Idea behind Recommender Systems 과거의 선호도를 기반으로 미래의 선호도를 예측 a recommender system takes a set of users U and a set of items I and learns a function f such that: f : U x I -> R Recommendation vs. Search 검색으로는 한계가 있음, cu..

Information Diffusion • Information diffusion: process by which a piece of information (knowledge) is spread and reaches individuals through interactions. • Studied in a plethora of sciences. • We discuss methods from – Sociology, epidemiology, and ethnography – All are useful for social media mining. • We focus on techniques that can model information diffusion. • Sender(s). 확산을 시작하는 사람들(Oreo c..

Network and Community Evolution - 시간이 지나면서 nework, community 어떻게 바뀌는지? - 그 중에서도 바뀌지 않고 남아있는 부분은 어떤 것인지? - 어떤 것들이 바뀔 수 있는지 How Networks Evolve? 1. Network Segmentation 2. Graph Densification 3. Diameter Shrinkage network 변화의 경향성 1. Network Segmentation 2. Graph Densification • The density of the graph increases as the network grows(node-node connection 이 커짐) – The number of edges increases faster..

Why analyze communities? 1. Analyzing communities helps better understand users – Users form groups based on their interests 2. Groups provide a clear global view of user interactions 3. Some behaviors are only observable in a group setting and not on an individual level – Some republican can agree with some democrats, but their parties can disagree Social Media Communities • Formation: – When l..

대충 훑고 지나감 𝑃(𝑤_𝑖|𝑤_(𝑖−2),𝑤_(𝑖−1)) = 𝑃(𝑐_𝑖|𝑐_(𝑖−2),𝑐_(𝑖−1)𝑃(𝑤_𝑖|𝑐_𝑖) ㅇ 𝑃(𝑤_𝑖|𝑤_(𝑖−2),𝑤_(𝑖−1)) - trigram의 경우 10^(5*3)개를 추정해야하는데, 데이터 부족 문제가 생기므로 많은 tuple 0을 가지지만 자연 발화시 나타나는 경우가 많음 ㅇ 𝑃(𝑐_𝑖|𝑐_(𝑖−2),𝑐_(𝑖−1)𝑃(𝑤_𝑖|𝑐_𝑖) - 품사(pos : part of speech) ex) a beautiful flower -> 관사-형용사-(명사일 확률과 flower일 확률은?) parameter 수를 줄여서 안정적인 추정이 가능해짐(MB수준으로 경량화 가능) 𝑐_(𝑖−2),𝑐_(𝑖−1),𝑐_𝑖는 단어열 𝑤_(𝑖−2),𝑤_(𝑖−1),𝑤_𝑖에 대응하는 카테고리열 ..

DNN을 이용한 음향모델 input, output layer 어떻게 결정했는지가 궁금 무작정 늘린다고 좋은 것은 아님 -> 추정해야할 parameter 수가 늘어남 vector의 길이만큼 cluster seq로 나타낼 수 있음 매 frame마다 8천개 정도의 state를 두고 모델링하면 됨 입력 vector는 13 vector, filter bank... 등등이 됨 ㅇ DNN 기반음향모델시스템구성[Hinton 2010] - 입력 layer unit의 개수: 600개(= 15frames X 40 filterbankoutputs) - Hidden layer의 개수: 5~8 개(Layer 당unit의개수: 2,048 units) - 출력 layer unit의 개수: 6,000 ~ 10,000개(Tiedstat..