반응형

프로그래밍/머신러닝 딥러닝 프로젝트 후보 2

웹소설 문법 교정기 제작 방법

챗gpt한테 물어봤다 네이티브 언어(소설, 논문만의 고유어)를 구별하고 딥 러닝을 사용하여 맞춤법 및 띄어쓰기 오류를 수정할 수 있는 맞춤법 검사기를 만들려면 다음과 같은 일반적인 단계를 따르세요. 데이터 수집 및 전처리: 웹소설, 학술 논문 등 원어와 원어가 아닌 단어(웹소설, 논문만의 고유어)가 모두 포함된 대규모 텍스트 데이터셋을 수집합니다. 텍스트를 정리하고 토큰화하여 데이터를 전처리합니다. 언어 모델 교육: 순환 신경망(RNN) 또는 트렌스포머와 같은 딥 러닝 기술을 사용하여 언어 모델을 교육합니다. 모델은 이전 단어를 기반으로 문장의 다음 단어를 예측하는 방법을 학습해야 합니다. 언어 모델 미세 조정: 맞춤법 검사 및 모국어 식별이라는 특정 작업에 대한 언어 모델을 미세 조정합니다. 올바른 맞..

프로젝트 구상. 웹소설 문법 교정기

작가들이 매일 연재하는 웹소설은 검수가 제대로 이루어지지 않아서 맞춤법이 틀리는 경우도 많아. 그런데 맞춤법 검사기를 돌리면 맞춤법만 교정하고, 잘못 붙은 단어를 띄어쓰는것 뿐만 아니라 그 소설의 고유어, 예를 들면 해리포터의 '익스펠리아르무스', '아바다케다브라' 같은 것들도 띄어써버려서 문제야. 기존의 맞춤법 검사기의 문제를 딥러닝을 이용해 해결하고 싶어. 딥러닝을 이용해 고유어를 구별하면서 맞춤법, 띄어쓰기를 교정해주는 맞춤법 검사기를 만드는 방법이 뭘까?

반응형