ChatGPT 한 번 호출할 때, 그 응답이 어디서 어떻게 도착하는지 끝까지 추적해 본 적이 있는가. 모델은 OpenAI가 만들지만, 그 모델이 돌아가는 GPU는 누가 빌려주고, 그 GPU에 전기를 어디서 끌어오며, 응답이 사용자 브라우저까지 도달하는 마지막 100ms 구간은 누가 책임지는지를 따져보면 한국 투자자나 개발자들이 잘 모르는 회사들이 줄줄이 등장한다.
엔비디아는 칩 한 종류만 판다. 그 칩을 사서 데이터센터에 꽂고, 전력과 냉각을 공급하고, 네트워크로 묶고, 최종 사용자에게 추론 결과를 배달하는 일은 전혀 다른 12개 이상의 회사가 분업하고 있다. 이 글은 그 분업 구조에서 핵심 노드를 차지한 기업들을 골라, 무엇을 하는 곳인지, 왜 지금 주목해야 하는지, 어떤 위험이 있는지 정리한 자료다.
주식 종목 추천이 아니라 산업 지도(map)에 가깝다. 각 회사의 매출 구조, 핵심 고객, 기술적 차별점, 그리고 한국에서 잘 알려지지 않은 이유까지 한 번에 정리했다.
AI 인프라 12개 기업 한눈에 비교
| 회사 | 핵심 역할 | 대표 고객 / 파트너 | 주목 포인트 |
|---|---|---|---|
| Cloudflare | 엣지 추론·AI 게이트웨이 | 14개 이상 모델 제공자 중계 | 분기 매출 6억 달러대, 워커스 AI 급성장 |
| CoreWeave | GPU 전용 클라우드 | 마이크로소프트, OpenAI, 메타 | 2025년 매출 51억 달러, 백로그 668억 달러 |
| Groq | LPU 추론 칩 | 사우디 아람코 디지털, 엔비디아 라이선스 | 6.9B 달러 밸류에이션, 초저지연 토큰 생성 |
| Cerebras | 웨이퍼 스케일 칩 | G42, MBZUAI | 단일 칩 4조 트랜지스터, 2026년 IPO 재추진 |
| Tenstorrent | RISC-V 기반 AI 칩 | 현대차, 삼성, LG | Jim Keller 주도, 32B 달러 밸류에이션 가능성 |
| Equinix | 글로벌 코로케이션 | 280개 데이터센터, 77개 도시 | 2025년 매출 92억 달러, 액침 냉각 확대 |
| Digital Realty | 하이퍼스케일 코로 | 블랙스톤 70억 달러 합작 | 미국 최대 코로 REIT, 32.5억 달러 펀드 |
| Crusoe | AI 전용 데이터센터 | OpenAI 스타게이트, 마이크로소프트 | 텍사스 애빌린 1.2GW, 100억 달러 밸류 |
| Lambda | GPU 클라우드 + 워크스테이션 | 마이크로소프트 다년 계약 | NVIDIA 투자, 시리즈 E 15억 달러+ |
| SambaNova | RDU 추론 칩 | 인텔 협업, 엔터프라이즈 | SN50 칩, 에이전트형 AI 특화 |
| Nebius | 유럽 AI 클라우드 | 마이크로소프트 노르웨이 | 핀란드 100억 달러 데이터센터 |
| IREN | 재생에너지 GPU 클라우드 | 기업·연구기관 GPU 임대 | 비트코인 채굴에서 AI로 전환 |
추론 트래픽의 마지막 1마일을 점령한 클라우드플레어
클라우드플레어는 한국에서 'CDN 회사' 또는 'DDoS 막아주는 회사' 정도로 알려져 있지만, 2024년 이후 회사의 무게중심은 명백히 엣지 AI 추론 쪽으로 이동했다. 워커스 AI(Workers AI)는 전 세계 200개 이상 도시에 분산된 GPU 풀에서 50개 이상의 오픈소스 모델을 서버리스로 호출할 수 있게 만든 플랫폼이다.
2025년 4분기 클라우드플레어 매출은 6억 1450만 달러로 전년 동기 대비 34% 증가했고, 신규 연간 계약 가치(ACV)는 50%에 가깝게 늘었다. 이 성장의 상당 부분이 AI 추론 워크로드에서 나오고 있다는 것이 회사 측 설명이다. 단순 캐싱 회사에서 'AI 트래픽의 라스트 마일'을 책임지는 인프라 사업자로 정체성이 바뀐 셈이다.
AI 게이트웨이(AI Gateway)는 OpenAI, 앤트로픽, 구글 등 14개 이상 모델 제공자 호출을 단일 API로 묶어 캐싱·레이트 리밋·관측·페일오버를 처리한다. 즉 모델 호스팅이 아니라 호출 흐름 자체를 통제하는 위치를 잡았다.
엣지 추론은 거대 모델 학습이 아니라 작은-중간 모델의 즉시 응답이 핵심이다. 이미지 생성, 번역, 임베딩, 라이트웨이트 챗봇처럼 응답 100ms가 곧 매출인 워크로드에서 클라우드플레어 같은 분산형 인프라가 GPU 중앙집중 클라우드보다 단가·지연 모두 우위를 가진다.
워커스 AI가 노리는 시장
원시 GPU를 빌리려는 거대 학습 워크로드는 코어위브나 람다의 영역이고, 클라우드플레어가 노리는 것은 사용자 옆에서 도는 추론이다. 모델 14개 제공자를 단일 호환 API로 묶고, 호출당 과금에 캐시 적중 시 비용 0이라는 구조를 들고 나온 것이 핵심 차별점이다.
GPU 클라우드 신흥강자들의 실체
엔비디아 GPU를 가장 많이 산 회사가 누구냐고 묻는다면 마이크로소프트나 메타라고 답하기 쉽지만, 매출 대비 GPU 매입 비중으로 따지면 2022년 매출 1600만 달러에서 2025년 51억 달러로 폭증한 코어위브가 단연 압도적이다. 회사는 이미 668억 달러 규모의 계약 백로그를 쌓아두고 있다.
코어위브는 원래 이더리움 채굴 회사였다가 머신러닝 클라우드로 피벗했다. 2025년 3월 27일 나스닥에 상장하면서 공모가 40달러, 시가총액 약 230억 달러로 데뷔했다. 가장 큰 위험 신호는 매출의 약 3분의 1이 OpenAI 한 곳에서 나온다는 점이다. AI 캐펙스(CAPEX) 사이클이 꺾이거나 OpenAI의 결제력이 흔들리면 직격탄을 맞는 구조다.
람다(Lambda)는 GPU 워크스테이션을 팔던 작은 회사였다가 2025년 2월 4억 8천만 달러를 약 25-40억 달러 밸류에이션으로 조달했고, 같은 해 11월 시리즈 E로 15억 달러 이상을 추가로 끌어왔다. 마이크로소프트와 다년간 수십억 달러 규모의 GPU 공급 계약도 체결했다. NVIDIA가 지분 투자자로 들어와 있다는 점이 코어위브와 닮았다.
| GPU 클라우드 | 2025년 주요 이벤트 | 핵심 차별점 | 약점 |
|---|---|---|---|
| CoreWeave | IPO, 매출 51억 달러 | 대규모 학습 클러스터, 인피니밴드 우선 | OpenAI 의존도 높음 |
| Lambda | 시리즈 E 15억 달러+ | 워크스테이션-클라우드 통합 | 규모는 코어위브의 일부 |
| Crusoe | 100억 달러 밸류 | 자체 발전소 결합 'AI 팩토리' | OpenAI/오라클 의존 |
| Nebius | 핀란드 310MW 신축 | 유럽 데이터 주권 수요 | 미국 시장 침투 초기 |
| IREN | H100 클러스터 확대 | 100% 재생에너지 발전 | 비트코인 매출 잔존 |
크루소가 짓는 1.2GW 'AI 팩토리'
크루소(Crusoe)는 가스 플레어(폐가스)를 태워 발전기를 돌리고 그 전기로 채굴을 하던 회사로 출발했다. 지금은 텍사스 애빌린에서 OpenAI '스타게이트' 프로젝트의 1.2GW 캠퍼스를 짓고 있고, 2025년 10월 13.75억 달러 추가 조달로 기업가치 약 100억 달러를 인정받았다. 2025년 매출은 약 9.98억 달러, 전년 대비 262% 증가가 예상된다.
다만 2025-2026년 사이 OpenAI와 오라클이 애빌린 캠퍼스의 추가 확장을 일부 취소하고 마이크로소프트가 그 자리를 인수하는 등 발주처 변동이 잦다. 단일 메가 고객 의존이라는 동일한 리스크가 여기에도 있다.
엔비디아 대안을 노리는 칩 3사
그록(Groq), 세레브라스(Cerebras), 텐스토렌트(Tenstorrent)는 모두 엔비디아 H100·B200 라인의 대안을 만들겠다고 선언한 회사들이지만 접근법이 다르다.
그록의 LPU(Language Processing Unit)는 학습이 아니라 추론, 그것도 토큰 생성 지연 시간을 극단적으로 줄이는 데 모든 설계 결정을 집중했다. 2025년 2월 사우디아라비아와 15억 달러 규모의 칩 공급 약정을 맺었고, 7월에는 약 69억 달러 밸류에이션으로 7억 5천만 달러를 조달했다. 같은 해 후반에는 엔비디아와 비독점 추론 기술 라이선스 계약을 체결하면서 '엔비디아 대항마'에서 '엔비디아 생태계 협력자'로 포지션을 일부 조정했다.
세레브라스는 정반대 철학이다. 칩을 자르지 않고 12인치 웨이퍼 한 장 전체를 단일 칩으로 사용하는 WSE-3은 면적 4만 6225제곱밀리미터, 트랜지스터 4조 개, 125 페타플롭스를 기록한다. 노드 2048개를 묶으면 256 엑사플롭스에 도달한다. 매출의 24%가 UAE의 G42 한 곳에서 발생한다는 집중도 위험이 있고, 2025년 IPO 시도가 G42 관련 정부 심사로 한 차례 무산된 뒤 2026년 4월 재신청했다.
텐스토렌트는 AMD 라이젠과 애플 A 시리즈 핵심 인력 짐 켈러(Jim Keller)가 이끈다. RISC-V 오픈 명령어 셋 기반으로 칩을 설계해 ARM·x86의 라이선스 비용에서 자유롭다는 점이 차별점이다. 2024년 12월 시리즈 D에서 6억 9300만 달러를 조달해 약 26억 달러 밸류에이션을 받았고, 2025년 후반-2026년 상반기 사이 후속 라운드로 32억 달러 수준 밸류에이션 논의가 진행됐다. 현대차그룹, 기아, 삼성 투자 펀드가 주주로 들어와 있어 한국 산업계와 연결고리가 가장 두꺼운 곳이다.
AI 칩 스타트업의 밸류에이션은 대부분 선주문(특히 중동 국부펀드 계열) 한두 건에 크게 의존한다. 사우디 아람코 디지털, G42, 카타르 QIA 같은 큰 손이 빠지면 매출 곡선이 한순간에 꺾일 수 있다는 점을 항상 염두에 둘 것.
데이터센터 부동산 두 거인의 분업
AI 데이터센터를 직접 짓는 것은 자본이 너무 많이 든다. 그래서 엔비디아 GPU를 사서 꽂을 '공간'을 임대해주는 회사들이 따로 존재한다. 글로벌 코로케이션 시장에서 가장 큰 두 회사가 에퀴닉스와 디지털 리얼티다.
에퀴닉스(Equinix)는 77개 도시 280개 데이터센터를 가진 인터커넥션 중심 사업자다. 2025년 매출은 92억 1700만 달러로 전년 87억 4800만 달러 대비 7% 성장했고, 4분기 대형 거래의 60%가 AI 워크로드에서 직접 발생했다. 다만 2025년 10월 연간 가이던스를 92.1억-93.3억 달러로 하향한 것은 거래 클로징 지연 때문이었다.
디지털 리얼티(Digital Realty)는 하이퍼스케일러를 위한 대용량·고밀도 캠퍼스에 강점을 가진다. 2023년 말 블랙스톤과 70억 달러 합작 법인을 세워 미국·유럽 1티어 시장에서 약 500MW 규모 IT 용량을 개발하기로 했고, 2025년에는 32.5억 달러 규모의 미국 하이퍼스케일 펀드를 클로징했다.
| 항목 | Equinix | Digital Realty |
|---|---|---|
| 강점 | 인터커넥션 밀도, 도심 입지 | 하이퍼스케일 캠퍼스, 메가와트 단위 |
| 핵심 고객 | 기업, 통신사, 금융 | AWS, Azure, 메타 등 클라우드 |
| 2025 주요 사건 | 액침 냉각 60% 거래 견인 | 블랙스톤 펀드, 32.5억 달러 클로징 |
| 평균 랙 밀도 | 5-100 kW/랙 단계적 전환 | 100 kW/랙 이상 신축 캠퍼스 |
| 한국 노출 | 서울 5개 IBX | 서울 ICN10 등 |
두 회사를 같은 카테고리로 묶는 사람이 많지만, 에퀴닉스는 '연결성을 파는 회사'이고 디지털 리얼티는 '평방미터와 메가와트를 파는 회사'다. AI 학습은 디지털 리얼티가 가져가고, AI 추론·기업 데이터 교환은 에퀴닉스가 가져가는 구조로 분업이 굳어지고 있다.
전력·냉각·연결 - 보이지 않는 세 번째 층
GPU와 데이터센터 사이에는 또 다른 인프라 계층이 있다. 전력을 끌어오고, 100kW 랙을 식히고, GPU와 GPU를 PCIe·이더넷으로 묶는 일이다.
버티브(Vertiv)는 액침 냉각·고밀도 UPS·랙 통합 솔루션을 묶어서 OCP(오픈 컴퓨트 프로젝트) 호환 패키지로 공급한다. 2026년 데이터센터 디자인의 핵심 변수로 액침 냉각과 어댑티브 리퀴드 쿨링이 자리 잡으면서 회사는 AI 캐펙스의 직접 수혜주로 분류된다.
아리스타 네트웍스(Arista Networks)는 GPU 클러스터를 묶는 800G 이더넷 스위치 시장의 1위 사업자다. 엔비디아의 인피니밴드·스펙트럼-X 진영에 맞서 브로드컴 토마호크-5와 제리코-3 기반 칩으로 표준 이더넷 진영을 대표한다. 2025년 7020R4 시리즈를 발표해 AI/DC 리프 스위치 라인업을 강화했다.
아스테라 랩스(Astera Labs)는 PCIe 5/6 리타이머·기어박스·스마트 패브릭 스위치로 GPU와 CPU·SSD·네트워크 카드 간 신호 무결성을 보장한다. 2024년 상장 후 2025-2026년 사이 PCIe 6 양산을 본격화하며 AI 서버에 거의 표준 부품처럼 들어가게 됐다.
마벨(Marvell)은 구글, 아마존, 마이크로소프트 같은 하이퍼스케일러를 위한 커스텀 ASIC을 설계한다. 구글 TPU의 일부 라인과 차세대 추론용 ASIC 협업이 2025-2026년 사이 본격화되면서 'AI XPU' 매출이 회사 전체 성장의 핵심 동력이 됐다.
한국에서 이 회사들이 잘 안 보이는 이유
첫째, B2B 인프라 회사라 한국 일반 소비자 접점이 거의 없다. ChatGPT는 써도 그 ChatGPT가 코어위브 GPU에서 돌고 클라우드플레어 엣지로 나간다는 것까지 사용자가 알 필요는 없다.
둘째, 미국 증시 중소형주가 많다. 코어위브, 크루소, 람다, 세레브라스, 텐스토렌트, 그록, 네비우스 같은 회사들은 한국 증권사 리서치 커버리지가 사실상 없다. 상장된 코어위브와 IREN, 어플라이드 디지털 정도가 가끔 언급된다.
셋째, 매출 의존 구조가 너무 뚜렷해서 산업 분석가들도 일단 관망하는 분위기다. 코어위브-OpenAI, 크루소-OpenAI/MS, 세레브라스-G42, 그록-사우디라는 식으로 한두 고객에 매출이 묶여 있어 통상적인 SaaS·반도체 평가 모델이 맞지 않는다.
'AI 인프라 수혜주'라는 라벨 하나로 묶이지만 실제 비즈니스 모델은 모두 다르다. 코로케이션 REIT, GPU 임대 클라우드, 칩 팹리스, 엣지 네트워크, 발전 자산 결합형 데이터센터는 매출 인식 방식과 마진 구조가 전혀 다르므로 같은 PER·PSR로 비교하면 안 된다.
AI 인프라 지도를 읽는 법
AI 산업을 'OpenAI 대 앤트로픽 대 구글'의 모델 경쟁으로만 보면 절반만 본 것이다. 그 모델을 학습시키는 GPU(엔비디아·AMD·텐스토렌트·세레브라스·그록), GPU를 빌려주는 클라우드(코어위브·람다·크루소·네비우스·IREN), GPU를 꽂을 공간(에퀴닉스·디지털 리얼티·어플라이드 디지털), 공간을 식히고 묶는 부품(버티브·아리스타·아스테라·마벨), 그리고 결과를 사용자에게 배달하는 엣지(클라우드플레어)까지 이어지는 5계층 스택이 진짜 그림이다.
각 계층마다 1-3개 챔피언이 결정되는 중이고, 2026년이 그 챔피언들의 윤곽이 굳어지는 분기점이 될 가능성이 크다. 코어위브의 IPO 후 첫 풀이어 실적, 세레브라스의 재상장, 텐스토렌트의 양산 본격화, 크루소의 1.2GW 가동, 클라우드플레어 워커스 AI의 매출 분리 공시 같은 이벤트가 줄줄이 대기 중이다.
투자자라면 모델 회사 한두 곳에 베팅하기보다 이 5계층 중 어느 칸에 노출을 만들고 있는지를 먼저 확인하는 편이 합리적이다. 개발자라면 학습은 코어위브·람다, 추론은 클라우드플레어·그록·세레브라스, 엣지 캐싱은 클라우드플레어 같은 식으로 워크로드 종류별로 공급자 풀을 만들어두는 것이 비용·지연 양쪽에서 유리하다.
지금 당장 할 일은 단순하다. 자주 쓰는 AI 서비스의 약관·블로그·기술 문서를 한 번씩 열어 'powered by'나 'infrastructure partner' 항목을 확인해보면, 이 글에 나온 12개 회사 중 최소 두세 곳이 등장한다. 거기서부터 자기만의 AI 인프라 지도를 그려나가는 것이 가장 빠른 학습 경로다.