애플이 M5 Max의 벤치마크 점수를 사실상 공개했다. Geekbench 6 Metal 기준 GPU 점수 232,718점. 이 수치는 M3 Ultra(80코어 GPU)의 약 245,000점에 불과 5% 모자란 수준이며, NVIDIA RTX 5080의 Metal 벤치마크를 넘어선 것으로 확인됐다.
M5 Max는 18코어 CPU에 최대 40코어 GPU를 탑재한 칩이다. 전작 M4 Max(16코어 CPU, 40코어 GPU) 대비 멀티코어 CPU 성능이 약 14 - 15% 향상되었고, GPU 성능은 약 20% 이상 끌어올렸다. 특히 이번 세대부터 도입된 Fusion Architecture(퓨전 아키텍처)와 TSMC SoIC-MH 2.5D 칩렛 패키징은 애플 실리콘 역사상 가장 큰 구조적 변화다.
이 글에서는 M5 Max의 상세 스펙과 코어 구성, 전작 M4 Max 대비 성능 향상 폭, 그리고 NVIDIA RTX 5080과의 직접 비교까지 실측 데이터를 기반으로 분석한다.
M5 Max 상세 스펙과 코어 구성
M5 Max는 애플 실리콘 라인업에서 가장 강력한 모바일 칩이다. TSMC의 3세대 3나노미터(N3P) 공정으로 제조되며, 이번 세대부터 칩렛 설계를 처음으로 채택했다.
CPU 구성: 18코어의 새로운 계층 구조
M5 Max의 CPU는 총 18코어로 구성된다. 기존 애플 실리콘이 성능 코어(Performance)와 효율 코어(Efficiency)의 2단계 구조였다면, M5 Max는 슈퍼 코어(Super Core) 6개 + 성능 코어(Medium Core) 12개라는 새로운 구조를 채택했다.
슈퍼 코어는 최대 4.61GHz 부스트 클럭으로 동작하며, 애플이 직접 "세계에서 가장 빠른 CPU 코어"라고 명명한 최상위 코어다. 성능 코어는 4.38GHz로 동작하며, 기존 세대의 효율 코어를 대체한다. L3 캐시는 각각 16MB가 할당된다.
GPU 구성: 40코어 + Neural Accelerator
GPU는 최대 40코어 구성이다. M5 Pro의 20코어 GPU 다이 2개를 결합한 구조로, 각 GPU 코어에는 Neural Accelerator(뉴럴 가속기)가 내장되어 있다. 이 뉴럴 가속기는 LLM 프롬프트 처리와 AI 이미지 생성을 GPU 레벨에서 직접 가속한다.
애플 공식 발표에 따르면, M5 Max는 M4 Max 대비 AI 전용 GPU 컴퓨팅 성능이 4배 이상 향상됐고, M1 Max 대비로는 6배 이상 빠르다. 하드웨어 레이 트레이싱 엔진도 4세대로 업그레이드됐다.
| 항목 | M5 Max | M4 Max | M3 Max |
|---|---|---|---|
| CPU 코어 | 18코어 (6 슈퍼 + 12 성능) | 16코어 (4P + 12E) | 16코어 (12P + 4E) |
| GPU 코어 | 최대 40코어 | 최대 40코어 | 최대 40코어 |
| Neural Engine | 16코어 | 16코어 | 16코어 |
| 통합 메모리 | 최대 128GB | 최대 128GB | 최대 128GB |
| 메모리 대역폭 | 최대 614GB/s | 최대 546GB/s | 최대 400GB/s |
| 공정 | TSMC 3nm (N3P) | TSMC 3nm (N3E) | TSMC 3nm (N3B) |
| 칩 설계 | 칩렛 (Fusion Architecture) | 모놀리식 | 모놀리식 |
| CPU 부스트 클럭 | 4.61GHz | 4.51GHz | 4.05GHz |
M5 Max의 메모리 대역폭이 614GB/s로 M4 Max(546GB/s) 대비 약 12.5% 증가했다. 이 대역폭 향상은 대규모 AI 모델 추론 시 체감 속도에 직접적으로 영향을 미친다. 128GB 통합 메모리와 결합하면 로컬 환경에서 70B 파라미터급 LLM도 구동할 수 있다.
Fusion Architecture: 칩렛 설계의 도입
M5 Pro와 M5 Max에서 가장 주목할 구조적 변화는 Fusion Architecture의 도입이다. 기존 애플 실리콘은 하나의 다이에 CPU, GPU, Neural Engine을 모두 집적하는 모놀리식 설계를 사용했다. M5 Pro/Max부터는 CPU 다이와 GPU 다이를 분리한 칩렛 방식으로 전환했다.
TSMC의 SoIC-MH 2.5D 패키징 기술을 활용하여 두 개의 다이를 하나의 기판 위에 배치하고, 초고속 인터커넥트로 연결한다. 이 구조 덕분에 CPU와 GPU 간 열 간섭이 줄어들고, 각 다이의 수율이 개선되어 생산 비용도 절감된다.
칩렛 설계임에도 불구하고 통합 메모리(Unified Memory) 아키텍처는 그대로 유지된다. CPU와 GPU가 동일한 메모리 풀을 공유하므로, 데이터 복사 없이 두 프로세서가 직접 메모리에 접근할 수 있다. 이 점이 NVIDIA의 디스크리트 GPU와 근본적으로 다른 구조적 강점이다.
M5 Max GPU 벤치마크 점수 분석과 전작 비교
2026년 3월 6일 기준으로 Geekbench 데이터베이스에 등록된 M5 Max의 실측 벤치마크 점수를 정리하면 다음과 같다.
CPU 벤치마크 (Geekbench 6)
M5 Max의 CPU 점수는 싱글코어 4,268 - 4,297점, 멀티코어 29,043 - 29,233점으로 나타났다. 이 멀티코어 점수는 현재 시점에서 소비자용 CPU 중 최고 기록이다.
M3 Ultra(32코어 CPU)의 멀티코어 점수가 약 27,726점이므로, M5 Max는 절반 수준의 CPU 코어(18코어)로 M3 Ultra를 약 5% 초과한 셈이다. M4 Max(16코어, 약 25,600 - 25,900점)와 비교하면 14 - 15% 향상됐다.
GPU 벤치마크 (Geekbench 6 Metal)
GPU 성능을 측정하는 Metal 벤치마크에서 M5 Max는 218,772 - 232,718점 범위를 기록했다. 이 점수대는 M4 Max(약 179,230점 평균)를 약 29 - 34% 상회하는 수치다.
| 칩 | Geekbench 6 싱글코어 | Geekbench 6 멀티코어 | Metal GPU 점수 |
|---|---|---|---|
| M5 Max (40코어 GPU) | 4,268 - 4,297 | 29,043 - 29,233 | 218,772 - 232,718 |
| M4 Max (40코어 GPU) | 약 3,850 | 약 25,700 | 약 179,230 |
| M3 Ultra (80코어 GPU) | 약 3,261 | 약 27,726 | 약 243,531 |
| M3 Max (40코어 GPU) | 약 2,970 | 약 21,500 | 약 155,000 |
| M2 Ultra (76코어 GPU) | 약 2,800 | 약 21,400 | 약 174,000 |
M5 Max 40코어 GPU가 M3 Ultra 80코어 GPU의 95% 수준 성능을 내고 있다는 사실은 놀랍다. GPU 코어 수가 절반임에도 거의 동등한 성능을 달성한 것은 새로운 GPU 아키텍처와 Neural Accelerator의 효과가 크다.
Geekbench 벤치마크는 순간적인 최대 성능을 측정하는 특성이 있어, 장시간 지속되는 렌더링이나 영상 편집 작업에서의 실제 성능은 다를 수 있다. 3월 11일 정식 출하 이후 Blender, DaVinci Resolve 등 실무 벤치마크 결과가 추가로 공개될 예정이므로, 구매 결정은 종합 리뷰를 확인한 후 내리는 것이 바람직하다.
M5 Max vs NVIDIA RTX 5080: GPU 성능 직접 비교
이번 벤치마크에서 가장 주목받는 부분은 M5 Max의 Metal GPU 점수가 NVIDIA RTX 5080을 넘어섰다는 점이다. Cult of Mac의 분석에 따르면, M5 Max의 40코어 GPU는 동일한 Geekbench Metal 벤치마크에서 RTX 5080보다 높은 점수를 기록했다.
다만, 이 비교에는 중요한 맥락이 필요하다. 두 칩은 근본적으로 다른 아키텍처를 사용하며, 실제 워크로드에서의 성능 양상도 크게 다르다.
| 항목 | M5 Max (40코어 GPU) | RTX 5080 (데스크톱) | RTX 5080 (노트북) |
|---|---|---|---|
| GPU 코어 | 40 Apple GPU 코어 | 10,752 CUDA 코어 | 7,680 CUDA 코어 |
| FP32 연산 성능 | 약 18 TFLOPS (추정) | 56.28 TFLOPS | 약 36 TFLOPS |
| 메모리 | 최대 128GB 통합 | 16GB GDDR7 전용 | 16GB GDDR7 전용 |
| 메모리 대역폭 | 614GB/s | 960GB/s | 약 576GB/s |
| TDP | 약 45 - 60W (칩 전체) | 360W | 약 150W |
| 레이 트레이싱 | 4세대 하드웨어 RT | 4세대 RT 코어, 171 TFLOPS | 4세대 RT 코어 |
| AI 가속 | GPU 내 Neural Accelerator | 5세대 Tensor 코어, 1,801 AI TOPS | 5세대 Tensor 코어 |
| Geekbench 6 Metal | 218,772 - 232,718 | RTX 5080보다 M5 Max가 높음 | 약 180,000 - 190,000 (OpenCL) |
순수 연산 성능(TFLOPS) 기준으로는 RTX 5080이 M5 Max의 약 3배에 달한다. 56.28 TFLOPS(RTX 5080) vs 약 18 TFLOPS(M5 Max 추정)의 차이는 분명하다. 게이밍, 특히 4K 해상도의 AAA 타이틀에서 RTX 5080이 압도적인 것은 이 때문이다.
그러나 M5 Max는 전력 효율에서 압도적이다. 칩 전체 소비 전력이 45 - 60W 수준인 반면, RTX 5080 데스크톱은 360W를 소모한다. 와트당 성능으로 환산하면 M5 Max가 수 배 이상 효율적이다.
또한 통합 메모리 128GB라는 점은 AI/ML 워크로드에서 결정적 강점이다. RTX 5080의 16GB VRAM으로는 대형 언어 모델(LLM)을 로컬에서 구동하기 어렵지만, M5 Max는 128GB 통합 메모리를 GPU가 직접 활용할 수 있어 70B급 모델도 로딩이 가능하다.
Metal 벤치마크 점수에서 M5 Max가 RTX 5080을 앞선 것은 사실이지만, 이는 Metal API에 최적화된 Apple GPU의 특성이 반영된 결과다. OpenCL이나 CUDA 기반의 벤치마크에서는 RTX 5080이 여전히 우위에 있을 가능성이 높다. 작업 환경과 사용하는 소프트웨어에 따라 어떤 칩이 더 적합한지 달라진다.
게임 성능만 놓고 보면 M5 Max와 RTX 5080의 직접 비교는 공정하지 않다. macOS 게임 생태계는 Windows 대비 매우 제한적이며, 동일 타이틀이라도 Metal 최적화 수준에 따라 프레임 레이트 차이가 크다. 게이밍 목적이라면 RTX 5080 탑재 노트북이 훨씬 현실적인 선택이다.
Qualcomm, Intel, AMD 모바일 칩과의 비교
M5 Max의 경쟁 상대는 NVIDIA만이 아니다. Qualcomm Snapdragon X Elite, Intel Core Ultra, AMD Ryzen AI 등 모바일 프로세서 시장의 주요 경쟁 칩과도 비교할 필요가 있다.
Geekbench 6 기준으로 M5 Max의 싱글코어 4,268점은 현존하는 모든 소비자용 프로세서 중 최고 수준이다. AMD의 64코어 Threadripper가 멀티코어에서 비슷한 영역에 있지만, 그 칩은 데스크톱 워크스테이션 전용이며 소비 전력이 350W 이상이다.
Intel Core Ultra 9 285HX 기반 노트북이 Geekbench 6 멀티코어에서 약 19,000 - 20,000점 수준인 것과 비교하면, M5 Max의 29,233점은 약 45 - 50% 이상 앞서는 수치다. Qualcomm Snapdragon X Elite가 약 14,000 - 15,000점 수준인 것을 감안하면, M5 Max는 ARM 기반 경쟁사와도 약 2배의 격차를 보인다.
애플은 M5 Max 발표에서 프로 워크플로우에서의 성능을 강조했다. 4K/8K 영상 편집, 3D 렌더링, 대규모 코드 컴파일, 로컬 AI 추론 등 전문 작업에서 M5 Max는 현재 노트북용 칩 중 사실상 대적할 상대가 없다.
M5 Max 탑재 MacBook Pro의 최고 사양 가격은 7,349달러(약 1,000만 원 이상)에 달한다. 비슷한 성능의 워크스테이션 노트북도 높은 가격대이긴 하지만, 가격 대비 성능만 따지면 M5 Max가 반드시 유리하다고 단정할 수 없다. 작업 환경에 맞는 소프트웨어 호환성, macOS vs Windows 생태계 차이를 함께 고려해야 한다.
M5 Max는 애플 실리콘의 5번째 세대로, 매 세대 꾸준히 10 - 20%의 성능 향상을 이어온 궤적의 정점에 서 있다. 이번 세대의 가장 큰 의미는 Fusion Architecture를 통한 칩렛 전환이다. 이 구조 변화 덕분에 향후 M5 Ultra에서는 두 개의 M5 Max 다이를 결합하여 80코어 GPU, 36코어 CPU, 256GB 통합 메모리라는 괴물 스펙이 가능해진다.
GPU 벤치마크에서 RTX 5080을 Metal 기준으로 넘어선 것은 상징적이지만, 실제 의미는 노트북이라는 폼팩터 안에서 데스크톱급 GPU에 근접하는 성능을 45W 소비전력으로 달성했다는 데 있다. 이것이 M5 Max의 진짜 가치다.
3월 11일 정식 출하가 시작되면 Blender, Cinebench, DaVinci Resolve, Unreal Engine 등 실무 벤치마크 결과가 쏟아질 것이다. 영상 편집, 3D 작업, AI 개발 등 프로 워크플로우를 다루는 사용자라면, 종합 리뷰가 나온 뒤 자신의 작업 환경에 맞는 구성을 신중히 선택하는 것을 권한다.