'09_DL(Deep_Learning)' 카테고리의 글 목록

09_DL(Deep_Learning) 39

surprise 다운로드 방법 01. Anaconda prompt를 열고 아래 명령어를 실행conda install -c conda-forge scikit-surprise

09_DL(Deep_Learning) 2025.05.16

설명 가능한 인공지능(XAI)XAI(Explainable AI)는 인간이 이해할 수 있는 방식으로 인공지능 모델의 의사결정 과정을 설명해주는 기술 및 접근 방식목표AI의 "블랙박스" 문제 해결신뢰성, 투명성, 책임성 확보XAI가 필요한 이유의료 : AI가 암이라고 판단한 이유를 의사가 납득해야 진단에 활용 가능금융 : 대출 거절 사유가 설명되지 않으면 고객 불신 유발법률/규제 : 자동화된 결정에 대해 이유를 요구할 수 있음자율주행 : 사고 발생 시 의사결정 과정을 분석해야 함AI 윤리 : 공정성, 편향 등을 검증하려면 설명 가능해야 함주요 XAI 기법LIMESHAPGrad-CAMsailency Map SHAP# pip install shap SHAP(타이타닉 생존자 예측)import pandas as ..

09_DL(Deep_Learning) 2025.05.11

33_bert_문서분류

# decoder가 필요한 부분이 거의 없으므로 Bert가 GPT보다 문서분류를 더 잘함 모델 구조입력 문장을 토큰화한 뒤 문장 시작과 끝을 알리는 스페셜 토큰 CLS 와 SEP를 각각 원래 토큰 시퀀스 앞뒤에 붙임위의 데이터를 BERT모델에 입력하고 문장 수준의 벡터(pooler_output)를 만들고, 이 벡터에 작은 추가 모듈을 덧붙여 모델 전체의 출력이 [해당 문장이 긍정일 확률, 해당 문장이 부정일 확률]의 형태가 되도록 학습import osimport pandas as pdfrom tqdm import tqdmimport torchfrom torch.utils.data import DataLoader, Datasetfrom transformers import BertTokenizer, Bert..

09_DL(Deep_Learning) 2025.05.11

32_트랜스포머

사전 학습 모델언어 모델(language model)시퀀스에 확률을 부여하는 모델단어 시퀀스를 입력받아 해당 시퀀스가 얼마나 그럴듯한지 확률을 출력하는 모델한국어 말뭉치로 학습한 언어 모델은 자연스러운 한국어 문장에 높은 확률값을 부여함문장에서 i번째로 등장하는 단어를 wi로 표시한다면 n개 단어로 구성된 문장이 해당 언어에서 등장할 확률, 즉 모델의 출력은 P(w1, w2, ..., wn) 처럼 쓸 수 있음n개 단어가 동시에 나타날 결합 확률(joint probability)을 의미잘 학습된 한국어 모델이 있다면 P(무모, 운전) 보다는 P(난폭, 운전)이 큰 확률값을 지녀야 함"난폭"이 나타난 다음에 "운전"이 나타날 확률을 조건부 확률(conditional probability)라고 함P(운전|난폭..

09_DL(Deep_Learning) 2025.05.11

31_트랜스포머_토큰화

토큰화문장을 토큰 시퀀스로 나누는 과정수행 대상에 따라 문자, 단어, 서브워드 등의 방법이 있음트랜스포머 모델은 토큰 시퀀스를 입력받으므로 문장에 토큰화를 수행해줘야 함토큰화를 수행하는 프로그램을 토크나이저(tokenizer)라고 함한국어 형태소 분석기는 토큰화 뿐만 아니라 품사 부착까지 수행 단어 단위 토큰화가장 쉽게 단어 단위 토큰화를 수행하는 방법은 공백으로 분리하는 것예) 어제 카페 갔었어 -> [어제, 카페, 갔었어]공백으로 분리하면 별도로 토크나이저를 쓰지 않아도 된다는 장점이 있지만, 한국어 데이터는 어휘 집합의 크기가 매우 커질 수 있음갔었어, 갔었는데요 처럼 표현이 살짝만 바뀌어도 모든 경우의 수가 어휘 집합에 포함되어야 하기 때문한국어 형태소 분석기를 사용하면 어휘 집합의 크기가 커지는..

09_DL(Deep_Learning) 2025.05.11

30_LLM의 개념

LLM 개념인공지능의 한 분야로, 대규모 데이터로 학습한 결과를 이용해서 인간의 언어를 처리하고 생성하며, 맥락을 이해하는데 사용됨Large Language Model의 약자인간의 언어를 처리하는 모델 언어 모델(Language Model)통계적 언어 모델초기의 언어 모델통계적 방법에 기반컴퓨터가 문장이나 단어를 얼마나 자연스럽게 표현할지를 수학적으로 계산언어 모델에서 사용하는 확률/통계적 방법 : n-gram언어의 통계적 패턴을 학습해서 문장을 이해하고 새로운 문장을 만들어내는 데에 도움을 줌단점가능한 모든 n-gram을 데이터베이스에 저장하고 있어야 하므로 데이터베이스를 사전에 만들어 두어야 함n이 커질수록 문맥을 제대로 이해하지 못하는 경우가 많음 신경망 언어 모델신경망을 기반으로 하는 언어 모델머..