기술 비교: 스테ganography 기법들
각 기법은 일반 텍스트처럼 보이는 안에 데이터를 숨기지만, 탐지 난이도, 용량, 견고성 측면에서 장단점이 달라요.
세 가지 기법 비교표
| 항목 | 영폭 문자(Zero-Width Characters) | 유사 문자 치환(Homoglyph Substitution) | 변형 선택자(Variation Selectors) |
|---|---|---|---|
| 탐지 난이도 | 매우 쉬움 | 어려움 | 중간 |
| 용량 | 높음 | 낮음 | 중간 |
| 견고성 | 취약함 | 우수함 | 중간 |
탐지 난이도
영폭 문자는 가장 먼저 들킬 수 있어요. 유니코드 스캐너나 16진수 편집기로 바로 확인되거든요. 출력되지 않는 코드 포인트는 숨길 수 없는 증거나 마찬가지예요.
유사 문자 치환은 좀 더 까다롭습니다. 라틴 문자와 키릴 문자를 비교할 수 없으면 구분하기 어려워요. 화면에는 똑같이 보이고, 대부분의 맞춤법 검사 도구도 이런 문자들을 정상으로 인식하거든요.
변형 선택자는 유니코드 스칼라를 훑거나 선택자를 감지하는 방식으로 찾을 수 있어요. 다만 일반 사용자 눈에는 텍스트가 변한 것처럼 보이지 않을 수 있습니다.
용량
영폭 문자는 용량이 가장 좋습니다. 어떤 텍스트도 캐리어로 쓸 수 있고, 메시지 길이에 따라 자유롭게 확장되거든요.
유사 문자 치환은 심각하게 제한돼요. 치환할 수 있는 문자 개수가 한정되어 있기 때문입니다. 이 구현에서는 라틴-키릴 쌍이 21개뿐이에요.
변형 선택자의 경우, 접미사 모드면 한두 글자에 바이트를 집중시킬 수 있어 용량이 나아집니다. 반면 글자별 모드는 텍스트에 포함된 글자 개수에 의존하므로 제약이 있어요.
견고성
영폭 문자는 매우 취약합니다. Slack, X(구 Twitter), 많은 이메일 클라이언트가 텍스트를 저장하거나 표시하기 전에 영폭 문자를 제거해버리거든요.
유사 문자 치환은 거의 모든 플랫폼에서 복사-붙여넣기를 견뎌냅니다. 이 기법을 특별히 제거하는 일반적인 휴리스틱이 없기 때문이죠. 따라서 견고성이 가장 우수해요.
변형 선택자는 중간 정도입니다. 순진한 복사-붙여넣기 환경에서는 영폭 문자보다 잘 남아있지만, NFC나 NFKC 정규화 과정에서 문자열 순서가 바뀌거나 일부가 축약될 수 있어요. 특히 보조 평면의 선택자는 일부 시스템에서 제거되기도 합니다.
AI 안전성을 위해 이게 중요한 이유
LLM 스테ganography는 AI가 실제로 어떻게 속일 수 있는지 보여주는 구체적인 사례입니다. 위의 기법들은 모두 인간 독자를 속이지만, 이를 찾기 위해 설계된 스캐너 앞에서는 모두 무너져요.
유니코드 범주 확인으로 영폭 문자를 잡을 수 있고, 유사 문자 알파벳 검사로 키릴 치환을 감지할 수 있으며, 코드 포인트 검사로 변형 선택자의 페이로드를 찾을 수 있거든요.
더 어려운 질문은 이겁니다. 모델이 인간의 검토를 통과하면서도 이전에 본 적 없는 자동 스캐너를 속일 수 있는 인코딩을 스스로 만들어낼 수 있을까? 이 부분이 AI 정렬(alignment) 분야의 핵심 과제예요.