본문 바로가기

DataMining20

추천시스템 - 영상 추천 시스템은 어떤 구조야? 1. 사례로 파악하자 ## 유투브 / 논문 1. data sources - video corpus - video feature - user history - context + other candidate sources 2. model - candidate generation - ranking https://static.googleusercontent.com/media/research.google.com/ko//pubs/archive/45530.pdf ## 틱톡 / 리버스 엔지니어링 1. data source 2. biz logic - Screening - Traffic allocation 3. model - Candidate? https://towardsdatascience.com/why-tiktok-m.. 2022. 5. 12.
추천시스템 - Metrics and DEVIEW 2017,2020 1. 성능평가지표에는 무엇이 있나? [ROC, AUC] 1종오류, 2종오류간 tradeoff를 각색해서 만든 지표가 precision(sensitivity)과 specificity임. Threshold가 변경됨에 따라 ROC값이 변함 ( multi-classifier는 one-the-other처럼 binary방식으로 바꿔서 성능평가 가능 ) https://koreapy.tistory.com/897 https://heeya-stupidbutstudying.tistory.com/entry/ML-%EB%AA%A8%EB%8D%B8-%ED%8F%89%EA%B0%80%EC%A7%80%ED%91%9C-%EC%98%A4%EC%B0%A8%ED%96%89%EB%A0%AC-PRC-ROC-AUC [F-scrore] data .. 2022. 5. 11.
DL - 기초; RNN ; LSTM, GRU - LSTM 등장 - 심플한 버전 등장 ; GRU. - 출처 excelsior-cjh.tistory.com/185 2021. 3. 3.
DL-기초; 어텐션 Attention 어텐션: 입력값 간의 관계를 찾기위해 등장. 1. 인코더에서 만들어진 은닉노드의 출력값 가져오기 --> 인코더의 입력노드별 은닉노드의 출력값 2. 디코더에서 만들어진 은닉노드의 출력값 곱하기 --> 디코더의 은닉노드는 1개씩만 가져올 수 있음 (순차대로 데이터 입력하니까 당연...) --> 곱하기 --> 인코더의 은닉노드별(= 입력노드별) 가중치 생성 --> 가중치를 확률로 변환 3. 인코더의 은닉노드*확률의 합 구하기 --> 맥락벡터 완성(context vector; attention value) --> 현재 디코더 입력값과 가장 연관성있는 인코더 정보를 담고 있다. 4. 주어진 정보 concat하기 -->디코더의 현시점 은닉정보St와 맥락정보(어텐션 밸류At)를 concat하기 --> MLP의 입력값.. 2021. 3. 3.