메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술저널
저자정보
Sihyun Oh (Seoul National University) Wooseok Song (Seoul National University) Youngchae Ahn (Seoul National University) Dongjun Jang (Seoul National University) Hyopil Shin (Seoul National University)
저널정보
한국언어학회 언어 언어 제49권 제4호
발행연도
2024.12
수록면
511 - 538 (28page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
This research evaluates the effectiveness of bidirectional language models, particularly those based on the BERT architecture, in distinguishing between human-authored text and machine-generated text in the Korean language. Through an extensive empirical analysis using a newly established benchmark, KoMGTDetect-Bench, we explore the linguistic attributes and complexities that differentiate machine-generated text from human-authored text, such as vocabulary usage, sentence structure, and syntax. Our findings reveal that BERT-based models excel in detecting subtle nuances and irregularities in text, attributing their success to the model’s deep semantic and syntactic understanding enabled by bidirectional context-aware training strategy. This study also examines the performance of these models across various linguistic phenomena specific to the Korean language, highlighting their strengths and limitations.

목차

1. Introduction
2. Related Works
3. KoMGTDetect-Bench: Korean Machine-Generated Text Detection Benchmark
4. Linguistic Characteristics of Human-Authored and Machine-Generated Texts
5. Experimental Setup
6. Result
7. Ablation Study: Performance Evaluation of Models Focusing on Six Korean Language Phenomena
8. Discussion
9. Conclusion
References

참고문헌 (0)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

최근 본 자료

전체보기

댓글(0)

0

UCI(KEPA) : I410-151-25-02-092177117