Question 1

입력한 프롬프트가 서버로 전송됩니까?

Accepted Answer

전송되지 않습니다. 토큰화 작업은 전적으로 브라우저 내에서 실행됩니다. cl100k_base와 o200k_base BPE 어휘는 페이지와 함께 번들로 로드되며, 인코더는 텍스트 영역만 읽습니다. 최초 페이지 로드 이후 어떠한 네트워크 호출도 발생하지 않으며, 프롬프트는 탭 밖으로 나가지 않습니다.

Question 2

OpenAI 외 모델의 토큰 수는 얼마나 정확합니까?

Accepted Answer

GPT-5, GPT-4.1, GPT-4o, GPT-4 Turbo, GPT-3.5는 OpenAI 공식 BPE 테이블 기반 정확값입니다. Claude, Gemini, Llama, DeepSeek은 o200k_base 기준선 위에 공개 샘플로 보정한 휴리스틱 계수를 적용하며, 각 제공자 공식 토크나이저와의 차이는 일반적으로 5~10% 이내입니다. 청구 금액에 직결되는 용도라면 제공자의 count_tokens API로 다시 확인하세요.

Question 3

가격은 실시간입니까?

Accepted Answer

가격은 2026년 5월 기준 수동 검토된 정적 참고 값입니다. 배치 요금, 지역별 과금, 프롬프트 캐시 할인은 수시로 바뀝니다. 예산 추정 출발점으로만 활용하고, 실제 운용 전 제공자 가격 페이지에서 반드시 재확인하세요.

Question 4

어느 정도 크기의 입력을 처리합니까?

Accepted Answer

한 세션당 약 500KB의 텍스트까지 처리합니다. 그 이상에서는 저사양 기기의 텍스트 영역이나 토크나이저가 끊길 수 있습니다. 배치 작업은 공식 토크나이저를 로컬에서 실행하세요 — OpenAI는 pip install tiktoken, Claude는 anthropic.tokenizers를 사용합니다.

Question 5

내 애플리케이션 토큰 수와 일치하지 않는 이유는?

Accepted Answer

프로덕션 앱은 system 프롬프트, function 또는 tool 정의, 이미지/오디오 토큰, 채팅 형식 오버헤드를 포함하지만 이 카운터는 의도적으로 그것들을 제외합니다. 카운터는 일반 텍스트 한 덩어리만 측정합니다. 청구 항목을 디버깅할 때는 사용자 입력 부분만 붙여넣고 앱이 보고하는 '사용자 메시지 토큰 수'와 비교하세요.

AI 토큰 카운터

Token counts & cost

사용 방법

토큰이란

로컬에서 세는 이유

제공자 간 비용 비교

개인정보 및 네트워크 동작

FAQ