Chat GPT_o3-mini VS DeepSeek R1

2025. 2. 1. 18:30경제/시황

728x90
반응형
SMALL

"회전하는 육각형 안에서 공이 튀는 것을 보여주는 Python 프로그램을 작성하세요. 공은 중력과 마찰의 영향을 받아야 하며, 회전하는 벽에서 현실적으로 튕겨 나와야 합니다."

프롬프트 입력시 출력상황
GPT o3-mini가 더 훌륭한 상황을 보여줌.

영상 : Flavio Adamo

Chat GPT o3-mini 출시하고 각 AI 모델별 정확도와 교정오차 내용


Accuracy : 정확도
Calibration Error : 교정오차

각 AI 모델별 정확도와 교정오차 내용

DeepSeek-R1과 o3-mini 계열 모델은

“멀티모달(문자·이미지 등 다양한 입력 동시 처리)” 기능이 아닌 순수 텍스트 기반으로만 평가

o3-mini(high)는 13.0%로 표에서 가장 높은 정확도 수치

교정 오차가 낮을수록 “예측에 대해 얼마나 확신해야 하는지”를 더 정확하게 알고 있다고 볼 수 있음

o3-mini 꽤 괜찮게 나온듯합니다.

728x90
반응형
LIST

'경제 > 시황' 카테고리의 다른 글

공포탐욕지수  (0) 2025.02.03
세계 핵무기 보유 현황  (1) 2025.02.03
테슬라_로보택시 "무선 충전"  (1) 2025.02.01
디사이 운동(DeSci)  (0) 2025.02.01
애플 실적 요약  (1) 2025.01.31