728x90

2025/04/28 3

14_순환신경망(텍스트 분류)-IMDB리뷰_데이터셋

순환신경망(텍스트 분류)- IMDB 리뷰 데이터셋 IMDB 리뷰 데이터셋유명한 인터넷 영화 데이터베이스인 imdb.com 에서 수집한 리뷰를 감상평에 따라 긍정과 부정으로 분류해 놓은 말뭉치 자연어 처리(natural language processing, NLP)컴퓨터를 사용해 인간의 언어를 처리하는 분야세부 분야음성 인식기계 번역감성 분석 등자연어 처리 분야에서는 훈련 데이터를 말뭉치(corpus) 라고 부름 임베딩사람이 쓰는 자연어를 기계가 이해할 수 있는 숫자의 나열인 벡터로 바꾼 결과 혹은 그 과정 전체컴퓨터에서 처리하는 모든 것은 숫자로 이루어진 데이터따라서 텍스트 그 자체를 신경망에 전달하지 않음합성곱 신경망에서 이미지를 다룰 때는 이미지가 정수 픽셀값으로 이루어져 있어서 특별히 변환을 하지..

13_순환 신경망(RNN)

순환 신경망 순차 데이터(sequential data)텍스트나 시계열 데이터(time series data)와 같이 순서에 의미가 있는 데이터예) "I am a boy"는 의미를 이해할 수 있지만 "boy am I a" 는 의미를 이해할 수 없음일별 온도 데이터에서 날짜 순서가 섞인다면 내일의 온도를 쉽게 예상하기 어려움감성분석에서는 이전에 입력된 데이터를 기억하는 기능이 중요할 수 있음예) "별로지만 추천해요" 에서 추천해요 를 해석할 때 앞의 "별로지만" 을 기억하고 있어야 무조건 긍정이라고 판단하지 않음퍼셉트론이나 CNN은 이런 기억장치가 없음하나의 배치를 사용하여 정방향 연산을 수행하고 나면 해당 샘플은 다음 샘플을 처리할 때 사용하지 않음이처럼 입력 데이터의 흐름이 앞으로만 전달되는 신경망을 ..

728x90