Large language models (LLMs) generate human-like text, raising concerns about their misuse in creating deceptive content. Detecting LLM-generated comments (LGC) in online news is essential for preserving online discourse integrity and preventing opinion manipulation. However, effective detection faces two key challenges; the brevity and informality of news comments limit traditional methods, and the absence of a publicly available LGC dataset hinders model training, especially for languages other than English. To address these challenges, we propose a twofold approach. First, we develop an LGC generation framework to construct a high-quality dataset with diverse and complex examples. Second, we introduce XDAC (XAI-Driven Detection and Attribution of LLM-Generated Comments), a framework utilizing explainable AI, designed for the detection and attribution of short-form LGC in Korean news articles. XDAC leverages XAI to uncover distinguishing linguistic patterns at both token and character levels. We present the first large-scale benchmark dataset, comprising 1.3M human-written comments from Korean news platforms and 1M LLM-generated comments from 14 distinct models. XDAC outperforms existing methods, achieving a 98.5% F1 score in LGC detection with a relative improvement of 68.1%, and an 84.3% F1 score in attribution.
AI๊ฐ ์ฌ๋ก ์กฐ์? KAISTโ๊ตญ๋ณด์ฐ, AI๊ฐ ์ด ๊ฐ์ง ๋ด์ค ๋๊ธ ํ์ง ๊ธฐ์ ์ต์ด ๊ฐ๋ฐ
โ AI ์์ฑ ๋๊ธ, ์งง๊ณ ๊ตฌ์ด์ฒด๋ก ์์ฑ๋์ด ๊ธฐ์กด ํ์ง ๊ธฐ์ ๋ก๋ ์ด๋ ค์
โ AI ์์ฑ ๋๊ธ 98.5% ํ์งํ๊ณ , ์ด๋ค AI๊ฐ ์ผ๋์ง 84.3%๊น์ง ์๋ณ
โ ACL 2025์ ๋ ผ๋ฌธ ์ฑํโฆ โAI ์ฌ๋ก ์กฐ์ ๋์ ์ํ ํต์ฌ ๊ธฐ์ ๊ฐ๋ฐโ
๐๏ธ LGC Generation Framework: ์ฌ๋์ด ์๋ณํ๊ธฐ ์ด๋ ค์ด ๊ณ ํ์ง AI ์์ฑ ๋๊ธ ๋ฐ์ดํฐ๋ฅผ ๊ตฌ์ถํ๊ธฐ ์ํด ๊ฐ๋ฐํ ํ๋ ์์ํฌ.
๐ AI์์ฑ๋๊ธ๊ณผ ์ฌ๋์์ฑ๋๊ธ ๋งํฌ ๋ถ์: ํ๊ตญ์ด ๋ด์ค ๊ธฐ์ฌ์ ์งง์ ํ์ ์ฌ๋์์ฑ๋๊ธ ํ์ง ๋ฐ ์์ฑ ๋ถ์์ ์ํด ํ ํฐ ๋ฐ ๋ฌธ์ ์์ค์์ ๊ตฌ๋ณ๋๋ ์ธ์ด์ ํจํด์ ๋ฐ๊ฒฌํ๊ธฐ ์ํด ์ค๋ช ๊ฐ๋ฅํ AI(XAI)๋ฅผ ํ์ฉํ ์ฒด๊ณ์ ์ธ ๋ถ์์ ์ํ.
๐ XDAC ๊ฐ๋ฐ: XAI ๊ธฐ๋ฐ ํ์ง ๋ฐ ์์ฑ ๋ถ์ ํ๋ ์์ํฌ์ธ XDAC๋ฅผ ๊ฐ๋ฐํ์ฌ AI์์ฑ๋๊ธ ํ์ง์์ 98.5% F1 ์ ์(๊ธฐ์กด ์ฐ๊ตฌ ๋๋น 68.1% ์๋์ ๊ฐ์ )์ ์์ฑ ๋ถ์์์ 84.3% F1 ์ ์๋ฅผ ๋ฌ์ฑ.
๐๏ธ ์ฌ๋ก ์กฐ์, ๋๋ ์์ฐ ์๋ ์ง์ โฆ AI ๋๊ธ ๊ณต์ฅ์ ์ํ : AI๋ฅผ ํ์ฉํ ์ฌ๋ก ์กฐ์์ ์ด๋ฏธ ํ์ค์ด ๋์๋ค. ์์ฑํ AI๋ ๋ช ์๊ฐ ์์ ์์ญ๋ง ๊ฐ์ ๋๊ธ์ ์๋์ผ๋ก ๋ง๋ค์ด๋ผ ์ ์๋ค. OpenAI GPT-4o API๋ฅผ ๊ธฐ์ค์ผ๋ก ํ๋ฉด ๋๊ธ 1๊ฐ ์์ฑ ๋น์ฉ์ ์ฝ 1์ ์์ค์ด๋ฉฐ, Google์ Gemma, Alibaba์ Qwen, LG AI์ EXAONE๊ณผ ๊ฐ์ ๊ณต๊ฐ๋ LLM์ ์์ฒด GPU ์ธํ๋ผ๋ง ๊ฐ์ถ๋ฉด ์ฌ์ค์ ๋ฌด์์ผ๋ก๋ ๋๋ ๋๊ธ ์์ฑ์ด ๊ฐ๋ฅํ๋ค. ๊ตญ๋ด ์ฃผ์ ๋ด์ค ํ๋ซํผ์์ ํ๋ฃจ ํ๊ท ์ฌ์ฉ์๋ค์ด ์์ฑํ๋ ๋๊ธ์ ์ฝ 20๋ง ๊ฐ ์์ค์ธ๋ฐ, ์์ฑํ AI๋ฅผ ํ์ฉํ๋ฉด 20๋ง ์์ ๋น์ฉ์ผ๋ก ์ด์ ์ ์ฌํ ๊ท๋ชจ์ ๋๊ธ์ ์๋ ์์ฑํด ์ฌ๋ก ์กฐ์์ ์ ์ฉํ ์ ์๋ค. ์งง๊ณ ๊ตฌ์ด์ฒด๋ก ๊ตฌ์ฑ๋ ๋๊ธ์ ๋ด์ค ๊ธฐ์ฌ ๋งฅ๋ฝ์ ๋ง๊ฒ ๊ฐ์ ยท๋ ผ์กฐ๊น์ง ์กฐ์ ๊ฐ๋ฅํ๋ฉฐ, ์์ฑ ์๋๋ ๋น ๋ฅด๋ค. ์ ๋ ดํ๊ณ ๋น ๋ฅด๋ฉฐ ๋๋ ์์ฐ ๊ฐ๋ฅํ AI ์์ฑ ๋๊ธ, ์ด์ ๋ ์ฌ๋ก ์ ํ๋ค ์ ์๋ ํ์ค์ ์ธ ์ํ์ด ๋์๋ค.
๐๏ธ ๊ธฐ์กด AI ํ์ง ๊ธฐ์ , ์งง๊ณ ๊ตฌ์ด์ฒด์ธ ํ๊ตญ์ด ๋๊ธ์ '๋ฌด์ฉ์ง๋ฌผ' : ๊ธฐ์กด AI ์์ฑ๊ธ ํ์ง ์ฐ๊ตฌ๋ค์ ๋๋ถ๋ถ ์์ด ๊ธฐ๋ฐ์ ์ฅ๋ฌธ ํ ์คํธ๋ฅผ ๋์์ผ๋ก ๊ฐ๋ฐ๋๋ค. ๋ ผ๋ฌธ์ด๋ ๋ด์ค์ฒ๋ผ ์ ํํ๋ ๊ตฌ์กฐ์ ๊ธ์ ์ด์ ์ ๋ง์ถ ๋ชจ๋ธ์ด ๋ง๊ณ , ๋ํ์ ์ธ ํ์ง ๋๊ตฌ์ธ GPTZero ์ญ์ ์ต์ 250์ ์ด์์ ์ ๋ ฅ์ ์๊ตฌํ๋ค. ์ด๋ ๋๋ถ๋ถ์ ํ์ง ๋ชจ๋ธ์ด ๋ฌธ์ฅ ๊ธธ์ด์ ๋ฐ๋ผ ๋์ ๋๋ ๋จ์ด ๋ถํฌ์ ํต๊ณ์ ํน์ฑ์ ํ์ฉํด AI ํน์ ์ ํํ ํจํด์ ๊ตฌ๋ณํ๊ธฐ ๋๋ฌธ์ด๋ค. ๋ฌธ์ฅ์ด ๊ธธ์๋ก ํต๊ณ์ ํน์ง์ด ๋๋ ทํด์ง๊ณ , ์ด์ ๋ฐ๋ผ ํ์ง ์ ํ๋๋ ๋์์ง๋ ๊ตฌ์กฐ๋ค. ํ์ง๋ง ํ๊ตญ์ด ๋ด์ค ๋๊ธ์ ์์ด๊ฐ ์๋๊ณ , ํ๊ท 51์ ๋ด์ธ๋ก ๋งค์ฐ ์งง๋ค. ์ด์ฒ๋ผ ์งง์ ํ ์คํธ๋ ๋จ์ด ์๊ฐ ์ ์ด ํต๊ณ์ ๋ถ์์ด ์ถฉ๋ถํ ์ด๋ค์ง๊ธฐ ์ด๋ ต๊ณ , ํ์ง ์ ํ๋๊ฐ ๋จ์ด์ง ์๋ฐ์ ์๋ค. ํนํ ์ด๋ชจ์ง, ๋น์์ด, ๋ฐ๋ณต ๋ฌธ์ ๋ฑ ๋น์ ํ ๊ตฌ์ด ํํ์ ๊ธฐ์กด ํ์ง ๋ชจ๋ธ์ด ํ์ตํ ํ ์คํธ ํจํด๊ณผ ์์ดํด, ํจ๊ณผ์ ์ธ ํ์ง๊ฐ ์ด๋ ต๋ค. ๋ํ, ์ด๋ฌํ ํ์ง ๋ชจ๋ธ ํ์ต์ ํ์ฉํ ๋งํ ํ์ค์ ์ธ ํ๊ตญ์ด AI ์์ฑ ๋๊ธ ๋ฐ์ดํฐ์ ๋ ์ ๋ฌดํ ์ํฉ์ด๋ค.
AI ๋๊ธ ์์ฑ ํ๋ ์์ํฌ : ํ์ค์ ์ธ ํ๊ตญ์ด AI ์์ฑ ๋๊ธ ๋ฐ์ดํฐ์ ์ด ๋ถ์กฑํ๊ณ , ๊ธฐ์กด์ ๋จ์ํ ํ๋กฌํํ ๋ฐฉ์์ผ๋ก๋ ๋ค์ํ๊ณ ์ค์ ์ ์ธ ๋๊ธ์ ์์ฑํ๋ ๋ฐ ํ๊ณ๊ฐ ์์๋ค. ์ฐ๊ตฌํ์ โฒ14์ข ์ ๋ค์ํ LLM ํ์ฉ โฒ์์ฐ์ค๋ฌ์ ๊ฐํ โฒ์ธ๋ฐํ ๊ฐ์ ์ ์ด โฒ์ฐธ์กฐ์๋ฃ๋ฅผ ํตํ ์ฆ๊ฐ ์์ฑ์ ๋ค ๊ฐ์ง ์ ๋ต์ ์ ์ฉํ AI ๋๊ธ ์์ฑ ํ๋ ์์ํฌ๋ฅผ ๊ฐ๋ฐํด, ์ค์ ์ด์ฉ์ ์คํ์ผ์ ๋ชจ๋ฐฉํ ํ๊ตญ์ด AI ์์ฑ ๋๊ธ ๋ฐ์ดํฐ์ ์ ๊ตฌ์ถํ๊ณ ์ด ์ค ์ผ๋ถ๋ฅผ ๋ฒค์น๋งํฌ ๋ฐ์ดํฐ์ ์ผ๋ก ๊ณต๊ฐํ๋ค.
AI ๋๊ธ ์ฌ๋ํ๊ฐ: "์ฌ๋์ด ์ผ๋ค๊ณ ๋ฏฟ์๋ค"โฆ AI ์์ฑ ๋๊ธ, ํ๊ฐ์ ์ ๋ฐ ์ด์์ด ์คํ : ์ฐ๊ตฌํ์ AI ์์ฑ ๋๊ธ๊ณผ ์ฌ๋ ์์ฑ ๋๊ธ์ ์ฌ๋์ด ๊ตฌ๋ณํ ์ ์๋์ง ์คํํ๋ค. ์ด 210๊ฐ์ ๋๊ธ์ ํ๊ฐํ ๊ฒฐ๊ณผ, AI ์์ฑ ๋๊ธ์ 67%๋ฅผ ์ฌ๋์ด ์์ฑํ ๊ฒ์ผ๋ก ์ฐฉ๊ฐํ๊ณ , ์ค์ ์ฌ๋ ์์ฑ ๋๊ธ๋ 73%๋ง ์ ํํ ๊ตฌ๋ถํด๋๋ค. ์ฆ, ์ฌ๋์กฐ์ฐจ AI ์์ฑ ๋๊ธ์ ์ ํํ ๊ตฌ๋ณํ๊ธฐ ์ด๋ ค์ด ์์ค์ ์ด๋ฅด๋ ๋ค๋ ์๋ฏธ๋ค. AI ์์ฑ ๋๊ธ์ ์คํ๋ ค ๊ธฐ์ฌ ๋งฅ๋ฝ ๊ด๋ จ์ฑ(95% vs 87%), ๋ฌธ์ฅ ์ ์ฐฝ์ฑ(71% vs 45%), ํธํฅ์ฑ ์ธ์(33% vs 50%)์์ ์ฌ๋ ์์ฑ ๋๊ธ๋ณด๋ค ๋์ ํ๊ฐ๋ฅผ ๋ฐ์๋ค.
์ค๋ช ๊ฐ๋ฅํ AI(XAI) ๊ธฐ๋ฒ์ ์ ์ฉํด ์ธ์ด ํํ์ ์ ๋ฐ ๋ถ์ : AI ์์ฑ ๋๊ธ์๋ ์ฌ๋๊ณผ ๋ค๋ฅธ ๊ณ ์ ํ ๋งํฌ ํจํด์ด ์์์ ํ์ธํ๋ค. ์๋ฅผ ๋ค์ด, AI๋ "๊ฒ ๊ฐ๋ค", "์ ๋ํด" ๋ฑ ํ์์ ํํ๊ณผ ๋์ ์ ์์ด ์ฌ์ฉ๋ฅ ์ ๋ณด์๊ณ , ์ฌ๋์ ๋ฐ๋ณต ๋ฌธ์(ใ ใ ใ ใ ), ๊ฐ์ ํํ, ์ค๋ฐ๊ฟ, ํน์๊ธฐํธ ๋ฑ ์์ ๋ก์ด ๊ตฌ์ด์ฒด ํํ์ ์ฆ๊ฒจ ์ฌ์ฉํ๋ค. LGC๋ AI ์์ฑ ๋๊ธ์, HWC๋ ์ฌ๋ ์์ฑ ๋๊ธ์ ๋ปํ๋ค.
ํน์๋ฌธ์ : AI๋ ์ ์ธ๊ณ์ ์ผ๋ก ํต์ฉ๋๋ ํ์คํ๋ ์ด๋ชจ์ง(๐ค, ๐, ๐ช, ๐ )๋ฅผ ์ฃผ๋ก ์ฌ์ฉํ๋ ๋ฐ๋ฉด, ์ฌ๋์ ํ๊ตญ์ด ์์(ใ , ใ , ใ ๋ฑ)์ด๋ ํน์ ๊ธฐํธ(ใ, โก, โ , โข ๋ฑ) ๋ฑ ๋ฌธํ์ ํน์์ฑ์ด ๋ด๊ธด ๋ค์ํ ๋ฌธ์๋ฅผ ํ์ฉํ๋ค.
์์ ๋ฌธ์(์ค๋ฐ๊ฟ, ์ฌ๋ฌ ์นธ ๋์ด์ฐ๊ธฐ ๋ฑ) : ์ฌ๋ ์์ฑ ๋๊ธ์ 26%๋ ์ด๋ฐ ์์ ๋ฌธ์๋ฅผ ํฌํจํ์ง๋ง, AI ์์ฑ ๋๊ธ์ ๋จ 1%๋ง ์ฌ์ฉํ๋ค. ๋ฐ๋ณต ๋ฌธ์(์: ใ ใ ใ ใ , ใ ใ ใ ใ ๋ฑ) ์ฌ์ฉ ๋น์จ๋ ์ฌ๋ ์์ฑ ๋๊ธ์ด 52%๋ก, AI ์์ฑ ๋๊ธ(12%)๋ณด๋ค ํจ์ฌ ๋์๋ค.
XDAC ๋ฐฉ๋ฒ๋ก : ์ฐ๊ตฌ์ง์ด ๊ฐ๋ฐํ ํ์ง ํ๋ ์์ํฌ โXDACโ๋ ๋จ์ํ AI ์์ฑ ์ฌ๋ถ๋ง์ ํ๋ณํ๋ ๋ฐ ๊ทธ์น์ง ์๊ณ , ์ด๋ค LLM์ด ํด๋น ๋๊ธ์ ์์ฑํ๋์ง๊น์ง ์๋ณํ ์ ์๋ ๊ธฐ๋ฅ์ ๊ฐ์ท๋ค. ์ด๋ฅผ ์ํด ๋ค์ ์ธ ๊ฐ์ง ๋ฐฉ์์ ๋ชจ๋ธ์ ์ ์ฉํ๋ค:
โ ์์ ๋ฌธ์ ์ฒ๋ฆฌ: ์ค๋ฐ๊ฟ, ๊ณต๋ฐฑ ๋ฑ์ ์์ ๋ฌธ์๋ฅผ ๋ณํํด ์ฌ๋์ ๋๊ธ ์์ฑ ์ต๊ด์ ํ์ต ๊ฐ๋ฅํ๊ฒ ํจ
โ ๋ฐ๋ณต ํจํด ๋ณํ: "ใ
ใ
ใ
ใ
ใ
" โ "
โ ์ฌ๋ ์์ฑ ๋๊ธ/AI ์์ฑ ๋๊ธ์ ๋งํฌ ๋ฐ์: XAI ๋ถ์์ ํตํด LLM๋ง๋ค ๋ค๋ฅธ ๋งํฌ ํน์ง์ ์ฐพ์๋ด๊ณ , ์ด๋ฅผ ํน๋ณํ ํ์(ํน์ ๋งํฌ๋ฅผ ๋ํ๋ด๋ ๊ธฐํธ)๋ก ์๋ ค์ค์ ๋ชจ๋ธ์ด AI ์์ฑ ๋๊ธ์ ๋งํฌ๋ฅผ ์ ์์๋ณด๋๋ก ๋์์ค
XDAC ์ฑ๋ฅํ๊ฐ : ์ด๋ฌํ ์ต์ ํ๋ฅผ ํตํด XDAC๋ AI ์์ฑ ๋๊ธ ํ์ง์์ 98.5% F1(์ ํ๋์ ์ฌํ์จ์ ํจ๊ป ๊ณ ๋ คํ ์ข ํฉ์ ์ธ ์ฑ๋ฅ ์งํ) ์ ์๋ฅผ ๊ธฐ๋กํด ๊ธฐ์กด ๋ฐฉ๋ฒ ๋๋น 68% ์๋์ ํฅ์์ ๋ฌ์ฑํ๊ณ , ๋๊ธ ์์ฑ LLM ์๋ณ์์๋ 84.3% F1 ์ฑ๋ฅ์ ๋ณด์ด๋ฉฐ ๋์ ์ฑ๋ฅ์ ์ ์ฆํ๋ค.
XDAC ๊ฒฐ๊ณผ ์์ : ๋๊ธ์ด ์ ๋ ฅ๋์ ๋, XDAC์ 1) AI ์์ฑ ๋๊ธ์ธ์ง, ์ฌ๋ ์์ฑ ๋๊ธ์ธ์ง ๋ถ๋ฅํ๋ค. 2) ๋ถ๋ฅ๋ ๋๊ธ์ด AI ์์ฑ ๋๊ธ์ผ ๊ฒฝ์ฐ, ์ด๋ค LLM์ด ์์ฑํ๋์ง ์๋ณํ๋ค. ๋ณธ ์์์์๋ ์ ๋ ฅ ๋๊ธ์ด LLM์ผ ํ๋ฅ 100%๋ก ๋ถ๋ฅํ๊ณ , Gemini ์ค gemini-2.0-flash-exp ๋ชจ๋ธ์ด ์์ฑํ์์ ์๋ณํ๋ค.
์ด๋ฒ ์ฐ๊ตฌ๋ ์์ฑํ AI๊ฐ ์์ฑํ ์งง์ ๋๊ธ์ ๋์ ์ ํ๋๋ก ํ์งํ๊ณ , ์ด๋ค LLM์ด ์์ฑํ๋์ง๊น์ง ์๋ณํ ์ ์๋ ๊ธฐ์ ์ ์ธ๊ณ ์ต์ด๋ก ์ ์ํ ๊ฒ์ผ๋ก, AI ๊ธฐ๋ฐ ์ฌ๋ก ์กฐ์์ ๋์ํ ์ ์๋ ๊ธฐ์ ์ ๊ธฐ๋ฐ์ ๋ง๋ จํ๋ค๋ ์ ์์ ํฐ ์์๊ฐ ์๋ค.
์ฐ๊ตฌํ์ XDAC๊ฐ ๋จ์ํ ํ์ง๋ฅผ ๋์ด ์๋ฐฉ ํจ๊ณผ๋ ๊ธฐ๋๋๋ค๊ณ ์ค๋ช ํ๋ค. ๋ง์น ๋ชจ๋ฐ ๋ง์ฝ ์ ๋ฐ ๊ฒ์ฌ, ์์ฃผ์ด์ ๋จ์, CCTV ์ค์น๊ฐ ๋ฒ์ฃ ์๋ ์์ฒด๋ฅผ ๊ฐ์์ํค๋ ๊ฒ์ฒ๋ผ, ์ ๋ฐํ AI ํ์ง ๊ธฐ์ ์ ์กด์ฌ๋ง์ผ๋ก๋ ์จ๋ผ์ธ ์ฌ๋ก ์กฐ์์ ์ํ AI ์ ์ฉ ์๋๋ฅผ ์ต์ ํ๋ ์ฌ๋ฆฌ์ ์ต์ ์ฅ์น๋ก ์์ฉํ ์ ์๋ค๋ ๊ฒ์ด๋ค.
ํนํ XDAC๋ ๋๊ธ์ AI ์์ฑ ์ฌ๋ถ๋ฟ ์๋๋ผ ์ด๋ค LLM์ด ์์ฑ๋๋์ง๊น์ง ์๋ณํ ์ ์์ด, AI ์์ฑ ๋๊ธ์ ์์ฑ ํจํด์ ๋ถ์ํ๊ณ ๋๊ท๋ชจ ์กฐ์ ํ๋์ ํ์งํ๋ ๋ฐ ํ์ฉํ ์ ์๋ค. ์ด๋ฌํ ๊ธฐ๋ฅ์ ํ๋ซํผ์ด ์์ฌ์ค๋ฌ์ด ๊ณ์ ์ด๋ ์กฐ์ง์ ์ธ ์กฐ์ ์๋๋ฅผ ๋ณด๋ค ์ ๋ฐํ๊ฒ ๊ฐ์ยท๋์ํ ์ ์๋๋ก ์ง์ํ๋ฉฐ, ํฅํ์๋ ์ค์๊ฐ ๊ฐ์ ์์คํ ์ด๋ ์๋ ๋์ ์๊ณ ๋ฆฌ์ฆ์ผ๋ก ํ์ฅ๋์ด AI ๊ธฐ๋ฐ ์ฌ๋ก ์กฐ์ ๋์์ ํต์ฌ ๊ธฐ์ ๋ก ์๋ฆฌ์ก์ ์ ์๋ค.
๋ํ ์ฐ๊ตฌํ์ด ๊ณต๊ฐํ ๋ฒค์น๋งํฌ ๋ฐ์ดํฐ์ ๊ณผ XDAC ๋ชจ๋ธ์ ํฅํ ๊ด๋ จ ์ฐ๊ตฌ ์ปค๋ฎค๋ํฐ์ ์ค์ง์ ์ธ ๊ธฐ์ฌ๋ฅผ ํ ์ ์์ ๊ฒ์ผ๋ก ๊ธฐ๋๋๋ฉฐ, ์์ฑํ AI ๊ธฐ๋ฐ์ ์ ์์ ์ธ ์ฝํ ์ธ ํ์ฐ ๋ฐ ์ฌ๋ก ์๊ณก ๋์์ ์ํ ๋ค์ํ ๊ธฐ์ ๊ฐ๋ฐ์ ์ถ๋ฐ์ ์ด ๋ ๊ฒ์ผ๋ก ์ ๋ง๋๋ค.