하이퍼커넥트

RSS

게시글: 112
등록: 2026년부터

All Frontend Backend AI DevOps Architecture Etc

AI
2부: 정책을 따르는 평가자, LLM-as-a-Judge
본 글은 Tinder의 AI-enabled Discovery 서비스에서 LLM을 활용하여 "당신은 왜 이 사람과 잘 맞을까요?"라는 질문에 답하는 설명을 생성하는 모듈 개발 과정을 다룹니다. 특히, 사람이 만든 설명 정책을 LLM Judge로 구조화하여 평가를 자동화하고, 이를 통해 디버깅 및 데이터 정제에 활용한 경험을 공유합니다. LLM 모델 개발을 위해서는 제품적 의사결정과 기술적 의사결정을 모두 고려한 엄밀한 "설명 정책" 수립이 필수적임을 강조하며, 이러한 정책을 실제 평가 시스템으로 구현하는 구체적인 방법을 소개합니다.
LLMLLM-as-a-Judge평가 자동화
하이퍼커넥트·2026년 4월 22일
AI
1부: 데이터도 정답도 없다: 하이퍼커넥트가 LLM을 길들이는 법
이 글은 Tinder의 AI-enabled Discovery 프로젝트를 예시로, 정답 데이터가 없는 open-ended generation 문제에서 '좋은 설명'을 정의하고 사람이 일관되게 평가할 수 있는 정책을 수립하는 과정을 다룹니다. 소개팅 주선자의 비유를 통해 설명의 중요성을 강조하며, LLM을 활용한 설명 생성 및 평가의 어려움과 이를 해결하기 위한 하이퍼커넥트의 접근 방식을 소개합니다. 특히, 명확한 정답이 없는 상황에서 어떻게 평가 기준을 세우고 일관성을 유지할 수 있는지에 대한 고민을 공유하며, 이는 LLM 기반 서비스 개발에 있어 중요한 시사점을 제공합니다. 2부에서는 LLM-as-a-Judge를 설계한 과정을 다룰 예정입니다.
LLMopen-ended generation설명 생성
하이퍼커넥트·2026년 4월 22일
AI
온디바이스 AI 얼굴 식별 파이프라인 최적화
하이퍼커넥트 Match Group AI 팀은 안드로이드 온디바이스 환경에서 AI 얼굴 식별 파이프라인 최적화 경험을 공유합니다. 데이팅 앱에서 프로필 사진의 중요성을 고려하여, 사용자의 갤러리에서 좋은 사진을 추천하는 AI 기술을 개발했습니다. 개인 정보 보호를 위해 모든 처리는 기기 내에서 이루어져야 하며, 이는 온디바이스 ML 기술의 핵심입니다. 본문에서는 모델 자체를 변경하지 않고 배치 방식과 실행 구조 개선을 통해 안드로이드 얼굴 식별 파이프라인의 응답 시간을 37% 단축하고 처리량을 530% 향상시킨 구체적인 최적화 과정을 설명합니다.
On-Device AI얼굴 식별머신러닝
하이퍼커넥트·2026년 1월 23일
AI
비즈니스 문제를 AI 문제로 정렬하는 방법
이 글은 비즈니스 문제를 AI 문제로 효과적으로 정렬하는 방법을 설명합니다. AI 조직은 본질적으로 비즈니스 문제를 최적화 문제로 재정의하고, 머신러닝 알고리즘을 통해 해를 찾아 비즈니스 문제를 해결합니다. 어려운 비즈니스 문제를 풀기 위해 최적화 이론의 '완화(relaxation)' 개념을 적용하는데, 특히 비볼록 문제를 볼록 문제로 변환하는 '볼록 완화(convex relaxation)'가 중요합니다. 이를 통해 복잡한 문제를 더 다루기 쉬운 형태로 바꾸고, 그 해가 원래 문제의 해와 유사한 결과를 도출하도록 설계합니다. 예를 들어, 특정 비즈니스 지표 개선이라는 원래 목표 대신 '분류기 학습'이라는 완화된 AI 문제로 접근하는 방식이 이에 해당합니다. 결국 AI 조직은 비즈니스 문제를 적절히 완화하고 최적화함으로써 비즈니스 임팩트를 창출합니다.
AI 문제비즈니스 문제최적화
하이퍼커넥트·2026년 1월 12일
AI
왜 막상 배포하면 효과가 없지? 타겟 지표에 맞는 ML모델 train/eval 설계하기
실제 서비스에 머신러닝 모델을 적용할 때, 비즈니스 목표와 연계된 타겟 지표를 설정하는 것이 중요합니다. 잘못된 지표를 최적화하면 모델 성능이 높아져도 서비스에 효과가 없을 수 있습니다. 이 글은 하이퍼커넥트 AI 조직의 실제 사례를 바탕으로, 문제 정의부터 모델 학습 목표 설정, 데이터셋 구축, 오프라인 평가, 온라인 A/B 테스트, 실제 배포까지의 전 과정을 소개합니다. 특히, 아이템의 여러 속성 중 전환율을 높일 대표 속성을 예측하는 AI 모델을 개발하는 과정을 통해, 비즈니스 문제를 어떻게 ML 문제로 재구성하고 실제 서비스 성과와 연결하는지를 보여줍니다. 이를 통해 ML 모델의 성공적인 현업 적용을 위한 실질적인 가이드라인을 제시합니다.
머신러닝모델 학습평가
하이퍼커넥트·2025년 11월 28일
AI
클릭 한 번으로 실험 시작! 이터레이션 사이클을 단축하는 추천 실험 시스템 개발기
아자르에서 추천 알고리즘의 성능 검증을 위한 사용자 대상 실험 프로세스의 병목 현상을 해결하기 위해 개발된 로우 코드(Low Code) 실험 시스템을 소개합니다. 기존에는 신규 알고리즘 적용을 위해 코드 수정 및 배포가 빈번하게 필요하여 실험 진행에 많은 시간이 소요되었으나, 이 시스템을 통해 JSON 설정 파일만으로 실험 명세를 작성하고 런타임에 실험군 할당 및 알고리즘 적용이 가능해졌습니다. 이를 통해 개발팀은 코드 변경 및 배포 없이 빠르게 이터레이션을 반복하며 실험을 진행할 수 있게 되었고, 실험 담당자는 소프트웨어 엔지니어의 스케줄에 구애받지 않고 원하는 시점에 실험을 시작할 수 있게 되어 전반적인 실험 사이클이 단축되었습니다.
추천 시스템A/B 테스팅머신러닝
하이퍼커넥트·2025년 8월 26일
DevOps
1:1 비디오 채팅 서비스는 E2E 회귀 테스트를 어떻게 자동화할까?
하이퍼커넥트의 SDET 팀은 1:1 비디오 채팅 서비스인 아자르의 E2E 회귀 테스트 자동화 경험을 공유합니다. 매 버전 업데이트 시 기존 기능의 안정성을 검증하는 회귀 테스트는 필수적이며, 특히 아자르의 핵심 기능인 1:1 비디오 채팅 테스트 자동화는 큰 허들이었습니다. 이를 해결하기 위해 테스트를 상호작용이 없는 'Non-interaction'과 상호작용이 필요한 'Interaction'으로 구분했습니다. Interaction 테스트는 하나의 테스트 내에서 두 개의 Appium driver를 생성하여 다른 사용자와의 상호작용을 시뮬레이션하는 방식으로 자동화했습니다. 이 접근 방식을 통해 복잡한 비디오 채팅 기능에 대한 E2E 회귀 테스트를 효과적으로 자동화하고, 반복적인 QA 작업을 줄여 개발 효율성을 높일 수 있었습니다.
E2E 테스트회귀 테스트자동화
하이퍼커넥트·2025년 6월 12일
AI
AI 실시간 추천 시스템을 위한 Flink 기반 스트림 조인 서비스 구축기
Azar는 AI 기반 실시간 매칭 시스템의 추천 품질 향상을 위해 Flink KeyedProcessFunction을 활용한 스트림 조인 서비스 구축 경험을 공유합니다. 유저의 다양한 이벤트를 실시간으로 조합하여 추천에 활용해야 하는 요구사항을 충족시키기 위해, Spark Streaming과 Kafka Streams 등 여러 기술을 검토한 후 Flink를 최종 선택했습니다. 특히, 밀리초 단위의 낮은 지연 시간, Exactly Once Semantics 보장, Zero downtime 배포라는 비기능 요구사항을 만족시키는 데 중점을 두었습니다. 이를 통해 파편화된 실시간 이벤트를 효과적으로 조합하고 안정적으로 추천 데이터를 제공하는 시스템을 구축했습니다.
Flink스트림 조인실시간 추천 시스템
하이퍼커넥트·2025년 6월 11일
Etc
Building Resilient, High Performance ScyllaDB Clusters with Super Disk
해당 글은 하이퍼커넥트 기술 블로그에서 제공하는 콘텐츠입니다. 하지만 요청된 페이지를 찾을 수 없다는 404 오류 메시지만 표시됩니다. 따라서 이 글의 구체적인 기술적 내용이나 주제, 결론을 파악할 수 없습니다. 블로그 자체의 로고, 회사 소개, 채용 정보, GitHub 링크 등이 포함되어 있으나, 기술적인 정보는 전혀 제공되지 않습니다. 오류 페이지는 "Page not found :("라는 메시지와 함께 페이지를 찾을 수 없음을 알리고 있습니다.
기술 블로그하이퍼커넥트404
하이퍼커넥트·2025년 5월 21일
DevOps
Building Resilient, High Performance ScyllaDB Clusters with Super Disk
Hyperconnect의 SRE 팀은 ScyllaDB 운영 중 노드 복구 시간이 길다는 문제를 발견했습니다. 이를 해결하기 위해 'Super Disk (Write-mostly RAID)' 기능을 도입하여 클러스터 롤링 업데이트 시간을 최대 10배 이상 단축하는 데 성공했습니다. 이 글은 ScyllaDB의 특징과 문제 상황을 설명하고, Super Disk 구성 전략, 성능 검증 결과, 그리고 Kubernetes 환경에서 이 기능을 효율적으로 관리하기 위한 Windmill 기반 자동화 과정을 상세히 다룹니다. 이를 통해 데이터 안정성을 높이고 운영 효율성을 개선한 Hyperconnect의 기술적 여정을 공유합니다.
ScyllaDBSuper DiskRAID
하이퍼커넥트·2025년 5월 15일
DevOps
Apache Flink 어플리케이션의 End-to-End Latency 병목 찾아내기
본 글은 Apache Flink 애플리케이션의 End-to-End Latency를 줄이기 위한 병목 지점 진단 및 개선 과정을 다룹니다. Azar 서비스의 핵심인 Flink 애플리케이션에서 사용자 만족도와 직결되는 낮은 지연 시간 확보를 위해, Flink operator 단위로 상세 지표를 수집하고 관찰하는 Application Level 단계와, 느린 operator에 대한 프로파일링 및 코드 레벨 검사를 수행하는 Operator Level 단계로 나누어 설명합니다. 특히, 처리 시간과 처리 외 시간으로 구분된 히스토그램 지표를 활용하여 병목의 원인을 정확히 파악하고, 이를 기반으로 효과적인 성능 개선 방안을 도출하는 방법을 제시합니다.
Apache FlinkEnd-to-End Latency병목 진단
하이퍼커넥트·2025년 3월 28일
Backend
Flink SQL 도입기
이 글은 Azar Matching Dev Team에서 이벤트 스트리밍 처리를 위해 Flink SQL을 도입한 경험을 공유합니다. 기존에 Kafka를 소스 및 싱크로 사용하는 애플리케이션 코드를 직접 작성하는 방식으로 Flink를 활용했으나, CPU 사용량이 높고 유지보수가 어려운 레거시 Flink 앱의 문제에 직면했습니다. 이 앱은 여러 매치 이벤트를 조인하고 조건부 로직을 수행하는 모놀리식 구조였으며, 인프라 변경으로 인해 정상 동작하지 않는 문제가 발생했습니다. 이를 해결하기 위해 Flink SQL을 도입하여 SQL만으로 이벤트 스트리밍 처리를 구현하는 방안을 모색했습니다. Flink SQL은 애플리케이션 코드 작성 없이 SQL 쿼리로 스트리밍 앱을 개발할 수 있게 하여, 레거시 시스템의 유지보수 부담을 줄이고 효율성을 높일 수 있는 대안으로 제시됩니다. 글에서는 Flink SQL 도입 이유와 클러스터 구축 및 운영 경험을 다룹니다.
Flink SQL이벤트 스트리밍데이터 처리
하이퍼커넥트·2025년 2월 18일
Backend
Spring Transactional Rollback Deep Dive
이 글은 Spring의 @Transactional 어노테이션에서 트랜잭션 롤백이 발생하는 경우를 심층적으로 분석합니다. 특히 Checked Exception과 Unchecked Exception이 롤백에 미치는 영향을 예시와 함께 설명하며, 트랜잭션 프록시의 동작 방식과 트랜잭션과 스레드의 상관관계까지 다룹니다. Spring의 기본 롤백 설정이 RuntimeException과 Error와 같은 Unchecked Exception에 맞춰져 있음을 설명하고, try-catch 블록으로 예외를 잡아도 롤백이 발생하는 메커니즘을 'rollback-only' 마킹 개념을 통해 이해하도록 돕습니다. 이를 통해 개발자들이 트랜잭션 관리 시 발생할 수 있는 혼란을 줄이고 정확한 예외 처리를 할 수 있도록 가이드합니다.
SpringTransactionalRollback
하이퍼커넥트·2025년 2월 10일
AI
아자르에서는 어떤 추천 모델을 사용하고 있을까?
하이퍼커넥트의 1:1 비디오 채팅 서비스인 아자르에서 사용자 경험 향상과 비즈니스 성과 증대를 위해 도입한 AI 추천 모델 CUPID를 소개하는 글입니다. 기존에는 수십만 줄에 달하는 복잡한 휴리스틱 규칙 기반의 매칭 알고리즘을 사용했으나, 이는 시간이 지남에 따라 성능이 저하되는 지연 문제(staleness problem)를 겪었습니다. 이에 AI 기반 추천 시스템으로 전환하여 사용자 행동 패턴을 분석하고, 더 정교한 추천을 통해 매칭 알고리즘의 효율성을 높였습니다. 이러한 AI 추천 시스템 도입은 아자르의 매출 성장을 견인하는 주요 요인으로 작용했습니다.
추천 시스템AI머신러닝
하이퍼커넥트·2024년 11월 19일
Backend
아자르 Data Lifecycle Policy 개발하기
글로벌 서비스 아자르에서 유저 데이터의 효율적인 보관 및 삭제를 위한 Data Lifecycle Policy 시스템 개발 과정을 소개합니다. 개인정보 보호 및 법적 대응을 위해 유저 탈퇴 또는 장기 미접속 시 데이터를 일정 기간 보관 후 삭제하는 정책을 구현했습니다. 데이터는 성격과 필드 단위로 보관 기간을 다르게 설정할 수 있으며, 모든 팀의 애플리케이션 및 분석용 데이터를 포함합니다. 시스템은 이벤트 기반 아키텍처로 설계되었으며, 예약부와 처리부로 나뉩니다. 유저 개인정보 삭제 예약 시 스케줄을 예약하고, 배치 처리를 통해 카프카 이벤트를 발행하여 데이터 삭제를 진행합니다. 이는 복잡한 삭제 트랜잭션 관리의 어려움과 대량 데이터 처리를 위한 REST API 호출의 한계를 극복하기 위한 방안입니다. 마이크로 서비스 아키텍처 환경에서 각 도메인의 데이터 책임을 다하고 테이블 변경에 유연하게 대응하는 것을 목표로 합니다.
Data Lifecycle Policy유저 데이터개인정보 삭제
하이퍼커넥트·2024년 11월 11일
AI
협업 필터링을 넘어서: 하이퍼커넥트 AI의 추천 모델링
본 글은 하이퍼커넥트 AI에서 추천 시스템의 모델링 방식을 협업 필터링을 넘어 어떻게 발전시키고 있는지 소개합니다. 기존 협업 필터링의 한계를 극복하기 위해 다양한 머신러닝 기법과 모델링 접근법을 탐구하며, 특히 cold-start 문제 해결 및 추천 정확도 향상에 초점을 맞춥니다. 논문들을 인용하며 이론적 배경을 설명하고, 실제 서비스에 적용 가능한 추천 모델링의 진화 과정을 보여줍니다. 이를 통해 사용자 경험을 개선하고 개인화된 추천을 제공하는 하이퍼커넥트 AI의 기술적 노력을 엿볼 수 있습니다.
추천 시스템협업 필터링모델링
하이퍼커넥트·2024년 10월 21일
AI
Behind the Paper: 하이퍼커넥트 AI 조직이 제품에 기여하면서 연구하는 법
하이퍼커넥트 AI 조직은 제품에 기여하는 연구를 수행하며 논문 출판까지 이르는 독특한 방식을 소개합니다. 일반적인 '제품 출시' 중심의 AI와 '논문 작성' 중심의 연구와는 달리, 실제 제품의 문제를 해결하기 위한 연구 과정을 상세히 설명합니다. 특히, 작업 A에서 사용하던 분류기를 작업 B에 미세조정했으나 성능이 저하된 사례를 통해 데이터셋의 레이블링 오류 문제를 발견했습니다. 비용 효율적인 해결책으로 노이즈 러닝 분야를 제품에 도입하여 높은 성능을 달성하는 것을 새로운 목표로 설정했습니다. 이 과정은 ECCV 2022 논문 출판으로 이어졌으며, 연구와 제품 기여의 균형을 맞추는 하이퍼커넥트의 AI 조직 문화를 보여줍니다.
AI하이퍼커넥트연구
하이퍼커넥트·2024년 10월 9일
Backend
하이퍼커넥트 그룹콜 미디어 서버 인프라를 소개합니다
하이퍼커넥트의 그룹 통화 서비스에 사용되는 미디어 서버 인프라를 소개하는 글입니다. 기존 라이브 스트리밍 인프라와의 차이점을 설명하며, 그룹 통화 서비스에서는 참여자 간의 양방향 미디어 송수신이 중요함을 강조합니다. 또한, 수십 명의 사용자가 동시에 소통하는 그룹 통화 서비스를 안정적으로 지원하기 위한 인프라 구조와 기술적 고려사항에 대해 다룹니다. 글은 하이퍼커넥트의 Media Server Team이 개발하고 운영하는 미디어 서버 인프라의 역할과 중요성을 설명하며, 특히 N:N 그룹 통화 기술의 복잡성과 이를 해결하기 위한 기술적 노력을 조명합니다.
그룹콜미디어 서버인프라
하이퍼커넥트·2024년 9월 25일
DevOps
글로벌 서비스에서 지역 통신사 네트워크 이슈 트러블슈팅하기
글로벌 서비스 Azar에서 발생하는 지역 통신사 네트워크 이슈 트러블슈팅 경험을 공유합니다. SRE 팀은 특정 국가의 소수 사용자에게만 발생하는 네트워크 문제를 해결하기 위해 데이터 분석에 집중했습니다. 초기에는 컴포넌트 A 관련 오류와 클라이언트 측 에러 발생이 관찰되었으나, 특정 통신사를 이용하는 사용자들에게서 문제가 집중되는 패턴을 발견했습니다. 기존 모니터링 도구로는 파악하기 어려웠던 이 문제를 해결하기 위해 사용자 그룹의 공통점을 찾고 장기적으로 증가하는 에러 추이에 주목했습니다. Databricks와 사내 플랫폼을 활용하여 클라이언트 에러 로그를 분석하며 문제의 근본 원인을 좁혀나가는 과정을 설명합니다.
SRE네트워크 이슈트러블슈팅
하이퍼커넥트·2024년 6월 24일
AI
아자르에서 AI 기반 추천 모델의 타겟 지표를 설정하는 방법 (feat. 아하 모멘트)
아자르에서 AI 기반 추천 모델의 타겟 지표를 설정하는 방법에 대한 글입니다. 기존 추천 시스템은 클릭률, 시청 시간 등 1차 지표 개선에 집중했지만, 서비스 성장을 위해서는 리텐션이나 매출과 같은 최종 지표 개선이 중요합니다. 아자르는 사용자 경험 개선과 서비스 경쟁력 강화를 위해 리텐션을 AI 추천 모델의 핵심 타겟 지표로 설정했습니다. 아하 모멘트 프레임워크를 활용하여 1차 지표 개선을 넘어 최종 지표에 직접적으로 기여하는 AI 모델을 학습시키는 방법을 소개하며, 이를 통해 사용자 만족도를 높이고 긍정적인 서비스 성장 사이클을 구축하는 것을 목표로 합니다.
추천 시스템리텐션AI 모델
하이퍼커넥트·2024년 4월 26일

하이퍼커넥트

2부: 정책을 따르는 평가자, LLM-as-a-Judge

1부: 데이터도 정답도 없다: 하이퍼커넥트가 LLM을 길들이는 법

온디바이스 AI 얼굴 식별 파이프라인 최적화

비즈니스 문제를 AI 문제로 정렬하는 방법

왜 막상 배포하면 효과가 없지? 타겟 지표에 맞는 ML모델 train/eval 설계하기

클릭 한 번으로 실험 시작! 이터레이션 사이클을 단축하는 추천 실험 시스템 개발기

1:1 비디오 채팅 서비스는 E2E 회귀 테스트를 어떻게 자동화할까?

AI 실시간 추천 시스템을 위한 Flink 기반 스트림 조인 서비스 구축기

Building Resilient, High Performance ScyllaDB Clusters with Super Disk

Building Resilient, High Performance ScyllaDB Clusters with Super Disk

Apache Flink 어플리케이션의 End-to-End Latency 병목 찾아내기

Flink SQL 도입기

Spring Transactional Rollback Deep Dive

아자르에서는 어떤 추천 모델을 사용하고 있을까?

아자르 Data Lifecycle Policy 개발하기

협업 필터링을 넘어서: 하이퍼커넥트 AI의 추천 모델링

Behind the Paper: 하이퍼커넥트 AI 조직이 제품에 기여하면서 연구하는 법

하이퍼커넥트 그룹콜 미디어 서버 인프라를 소개합니다

글로벌 서비스에서 지역 통신사 네트워크 이슈 트러블슈팅하기

아자르에서 AI 기반 추천 모델의 타겟 지표를 설정하는 방법 (feat. 아하 모멘트)