AI 시대의 인재,
새로운 방식으로 평가해요
특정 툴 숙련도가 아니라, 문제를 AI 에게 설명하고 · 검증하고 · 도구를 고르는 사고력을 측정해요. 결과물뿐 아니라 “어떻게 풀었는지”가 자동 수집되어, 평가자는 한눈에 과정을 봅니다.
- 평가 영역
- 5개
- 과제 시간
- 60–180분
- 자동 수집
- 100%

Why Probe
결과물만 보는 평가는,
더 이상 충분하지 않아요
누구나 AI 와 협업해 결과물을 낼 수 있는 시대. 같은 결과물도 누가 어떻게 만들었느냐에 따라 가치가 달라져요. 평가는 그 차이를 볼 수 있어야 합니다.
결과물만으론 못 봐요
AI 가 만든 결과물과 사람이 AI 와 함께 만든 결과물의 차이를, 최종 산출물만 봐선 구분할 수 없어요.
툴 숙련도 ≠ 능력
Cursor 헤비 유저라고 좋은 협업자는 아니에요. 진짜는 문제를 쪼개고 결과를 검증하는 사고력입니다.
공정성도 흔들려요
유료 구독·고가 도구 보유 여부가 평가에 영향을 주면, 잠재력 있는 후보를 놓쳐요.
How it works
지원자는 문제를 풀고,
평가자는 과정을 봅니다
지원자에겐 끊김 없는 과제 환경, 평가자에겐 결과물 + 타임라인을 한 화면에 제공해요. 둘 다 별도의 서술이 필요 없어요.
- 01Step 1
과제 시작
브라우저 웹 IDE 에 접속해 바로 시작. 내장 채팅·터미널, 그리고 무료 제공되는 상위 모델로 작업해요.
웹 IDE내장 AI 모델MCP 외부 도구 연결 - 02Step 2
과정 자동 수집
프롬프트·도구 전환·테스트 실행·git diff 가 모두 타임라인에 자동 기록돼요. 지원자는 따로 서술하지 않아요.
프롬프트 로그도구 전환테스트 결과git diff - 03Step 3
평가자 리뷰
결과물 + 5개 영역별 자동 수집 신호 + 사람의 정성 메모를 한 화면에 통합. 합/불은 다른 프로세스에서 결정해도 돼요.
타임라인 뷰5영역 채점태깅 · 메모
Evaluation areas
5개 영역으로 본 AI 평가
자동 수집으로 잡을 수 있는 신호와, 사람이 정성으로 봐야 하는 신호를 영역마다 분리해 매핑했어요.
문제 정의 능력
초기 프롬프트의 요구사항 분해, 하위 질문 분할 패턴을 추적해요.
- 요구사항 분해 단계 수
- 하위 질문 분할 패턴
- 제약·전제 명시 여부
프롬프트 설계 능력
제약·출력 형식 명시, context 첨부, system prompt 활용 빈도를 봐요.
- 출력 형식 명시 빈도
- context 첨부량
- system prompt 사용
결과 검증 · 비판적 사고
follow-up 비율, AI 결과 수정 지시, 붙여넣기 전 편집, 테스트 재실행 패턴.
- follow-up 비율
- 결과 수정 지시 횟수
- 붙여넣기 전 편집
- 테스트 재실행
도구 활용 효율
모델 선택 패턴, 툴 전환 빈도, 프롬프트 대비 완성도를 종합해요.
- 모델 선택 패턴
- 툴 전환 빈도
- 프롬프트 대비 완성도
최종 결과물
git diff, 테스트 통과율, 결과물 파일을 직접 확인해요. 자동 점수화는 하지 않아요.
- git diff
- 테스트 통과율
- 결과물 파일
타임라인 통합
5영역의 신호를 시간 순으로 한 화면에. 이벤트 클릭 → 원문(프롬프트·diff·로그) 즉시 확인.
- 이벤트 → 원문 점프
- 5영역 1~5점 채점
- 태그 · 메모
Fairness · Transparency
모두에게 같은 출발선,
그리고 보이는 것만 수집해요
플랫폼이 Claude · OpenAI · Gemini 상위 모델을 무료로 제공해요. 지원자가 어떤 유료 구독을 가지고 있느냐가 결과를 가르지 않습니다. 제출 전에는 어떤 기록이 전송될지 미리보기에서 확인하고, 항목별로 제외할 수도 있어요.
- AI 모델 제공
- 무료
- 제출 전 미리보기
- 100%
- 평가 후 자동 삭제
- 90일
- A동일 환경
지원자 A
· 유료 구독 없음ClaudeGPT-5Gemini Pro - B동일 환경
지원자 B
· Cursor Pro 사용자ClaudeGPT-5Gemini Pro - C동일 환경
지원자 C
· AI 도구 첫 경험ClaudeGPT-5Gemini Pro
Pilot · Adopt
파일럿부터 시작해 보세요
먼저 한두 포지션에 적용해 효과를 보고, 본격 도입은 그 다음에 결정해도 돼요.
Pilot
한 직군 · 최대 20명
- 지원자별 자동 수집 타임라인
- 5개 평가 영역 채점 도구
- Claude · OpenAI · Gemini 무료 제공
- 결과 90일 자동 삭제
- 도입 셋업 지원
파일럿 종료 후, 본격 도입 여부는 자유롭게 결정
Adopt
다수 직군 · 채용 시즌 단위
- 공고 무제한 + 시즌 단위 사용
- MCP 외부 도구 연동 커스터마이즈
- 회사 평가 영역 / 가중치 정의
- SSO · 감사 로그 · RBAC
- 전담 평가 디자인 워크숍
크래프톤·외부 기업 도입 사례 별도 공유
가격은 부가세 별도 · 파일럿은 한 회사당 1회 무료