RLHF
인간 피드백 강화학습 · Reinforcement Learning from Human Feedback
인간의 피드백을 통해 모델 출력의 품질을 개선하는 학습 방식
AI 관련 용어를 쉽게 이해할 수 있도록 정리했습니다.
인간 피드백 강화학습 · Reinforcement Learning from Human Feedback
인간의 피드백을 통해 모델 출력의 품질을 개선하는 학습 방식
순환 신경망 · Recurrent Neural Network
이전 출력을 다음 입력에 반영하여 순차적 데이터를 처리하는 신경망
추천 시스템 · Recommendation System
사용자의 취향과 행동을 분석하여 관련 콘텐츠나 상품을 자동으로 추천하는 AI 시스템
레드팀 · Red Teaming
AI 모델의 약점과 악용 가능성을 찾기 위해 의도적으로 악의적인 프롬프트를 시도하는 활동
회귀 · Regression
입력 데이터로부터 연속적인 수치값을 예측하는 머신러닝 작업
강화학습 · Reinforcement Learning
에이전트가 환경과 상호작용하며 보상을 최대화하는 행동을 학습하는 방법
검색 · Retrieval / Information Retrieval
대규모 데이터 저장소에서 질문이나 쿼리에 관련된 정보를 찾아내는 기술
소규모 언어 모델 · Small Language Model
수십억 이하의 파라미터를 가진 효율적인 언어 모델
스케일링 법칙 · Scaling Law
모델 크기, 데이터양, 연산량이 증가할수록 모델 성능이 예측 가능하게 향상되는 법칙
자기지도학습 · Self-supervised Learning
라벨 없이 데이터 자체에서 학습 신호를 만들어내는 학습 방법
감정 분석 · Sentiment Analysis
텍스트에 담긴 감정이나 의견의 긍정/부정/중립 여부를 자동으로 판별하는 NLP 작업
음성 인식 · Speech-to-Text / STT
사람의 음성을 자동으로 텍스트로 변환하는 AI 기술