메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학술저널
저자정보
저널정보
한국언어과학회 언어과학 언어과학 제26권 제1호
발행연도
2019.1
수록면
51 - 70 (20page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색

초록· 키워드

오류제보하기
This paper aims at modeling topics from TOEFL essay samples in the TOEFL11 corpus. The TOEFL11 corpus is a collection of 12,100 TOEFL writing samples submitted by test-takers from 11 different countries. The paper applied an unsupervised method (i.e. Latent Dirichlet Allocation or LDA) of clustering texts to written samples, with the aim of automatic modeling of topics. For each of the 11 non-native TOEFL test takers, 1,100 TOEFL essays were transformed to a document-term matrix, and then were fed into the LDA function in the R software. The number of potential topics was set to be 8, which was the same number of prompts the test takers had been given when they took the test. The overall accuracy ranged from 83% to 99% depending on the native language of the test takers. Further analysis needs to be conducted to see how reliably the unsupervised LDA method can be used in automatically classifying written samples to potential topics. Nevertheless, the paper provides an empirical foundation that automatic topic modeling can be applied in an unsupervised way even to the writing sample of English learners.

목차

등록된 정보가 없습니다.

참고문헌 (29)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

최근 본 자료

전체보기

댓글(0)

0