서비스는 중복된 아이템을 어떻게 다뤄야 할까?아마존 데이터 사이언티스트의 중복 상품 핸들링에 관한 모의 인터뷰를 흥미롭게 본 관계로, 이번 글은 서비스들이 중복 아이템 문제를 다루는 여러 방법에 대해 이야기해 보고자 합니다.Dec 5, 20201Dec 5, 20201
키워드 추출을 통해 이미지의 정보 얻기이번 포스트에서는 Pinterest Engineering Blog 의 Understanding Pins through keyword extraction 을 기반으로, 다른 모든 정보의 기반이 될 수 있는Annotation 정보를 어떻게 추출하고…Nov 21, 2020Nov 21, 2020
핀터레스트의 Interest Platform 만들기이번에 소개할 내용은 핀터레스트 엔지니어링 블로그에 2014년 올라온 Building the Interest Platform 입니다. 역시 꽤나 오래 전 글이지만, 2010년대 시작된 핀터레스트가 초기버전에서 어떻게 발전해 왔는지 살펴보는 데…Oct 25, 2020Oct 25, 2020
Ranking like Bayesian앞선 몇 차례의 포스트에서 직관에 따라 랭킹을 매기는 방법에 대해 알아보았습니다. 대부분의 랭킹들은 지금까지의 방법으로도 꽤 잘 동작하는데, 엄밀히 말하자면 그것은 그 랭킹 로직이 궁극적인 정답이어서가 아니라 랭킹이 동작하는 방식이 우리의 직관과…Sep 27, 2020Sep 27, 2020
뉴턴의 냉각 법칙에 따라 “Hot” 랭킹 매기기원래는 베이지안 랭킹에 대해 쓸 차례였는데, 생각보다 공부해야 할 부분이 많아서 이번 차수에는 조금 더 간단한 랭킹 냉각에 대한 글을 가져왔습니다.Sep 20, 2020Sep 20, 2020
평점 순으로 정렬하지 않는 법 : 실전편지난 글에서는 좋아요/싫어요로 평가된 데이터를 정렬하는 3가지의 방식과 각각의 장단점에 대해 알아보았습니다. 이번 글에서는 실제 데이터를 통해 각 방식대로 랭킹을 만들어보며 앞서 정의했던 문제점이 확인되는지 살펴보도록 하겠습니다.Sep 3, 2020Sep 3, 2020