티스토리 뷰

카테고리 없음

터보퀀트와 메모리 수요 (KV캐시, 재본스역설, 밸류에이션)

루크7851 2026. 6. 11. 13:59

압축 기술 하나가 반도체 주식을 흔들었습니다. 모건스탠리 보고서 한 장에 마이크론과 샌디스크가 3~5% 빠지는 걸 보면서, 저도 처음엔 "메모리 수요가 16분의 1로 줄어들면 하이닉스랑 삼성은 끝난 거 아닌가?" 하고 가슴이 철렁했습니다. 헤드라인이 주는 공포가 얼마나 빠르게 손가락을 움직이게 만드는지, 직접 겪어보니 새삼 실감하게 됩니다.

KV캐시와 터보퀀트, 뭐가 달라진 건가

이번에 시장을 흔든 기술의 이름은 터보퀀트(TurboQuant)입니다. 핵심은 KV캐시(Key-Value Cache)를 저장하는 방식 자체를 바꾼 것입니다. 여기서 KV캐시란 AI 모델이 대화 맥락을 기억하기 위해 임시로 저장해두는 데이터 공간을 말합니다. 쉽게 말해 긴 책을 읽다가 중간 내용을 잊지 않으려고 적어두는 컨닝 페이퍼 같은 역할입니다. 문제는 대화가 길어질수록 이 컨닝 페이퍼의 양이 폭발적으로 늘어난다는 점입니다.

기존 방식은 데이터를 저장할 때 32비트(FP32) 부동소수점으로 각 좌표값을 정밀하게 기록했습니다. 여기서 FP32란 숫자 하나를 표현하는 데 32개의 비트를 사용하는 데이터 형식으로, 정밀도가 높은 만큼 메모리를 많이 차지합니다. 터보퀀트는 이걸 3비트까지 낮춥니다. 방향과 거리만 알면 위치를 특정할 수 있다는 극좌표(Polar Coordinate) 개념을 응용한 것입니다. 극좌표란 x축·y축처럼 여러 값을 나열하는 대신, 기준점에서 어느 방향으로 얼마나 떨어져 있는지만 기록하는 좌표 체계입니다.

모건스탠리 테크바이트 리포트에 따르면 이 방식으로 메모리 부담이 16분의 1로 줄고, 연산 속도는 최대 8배까지 빨라지면서 정확도 손실은 거의 없다고 발표되었습니다. 소프트웨어만 교체하면 바로 적용 가능하다는 점에서 도입 장벽이 사실상 없다는 것이 가장 큰 특징입니다. 제가 이 부분을 읽으면서 "진짜면 대단하긴 한데, 너무 좋은 얘기 아닌가?" 하는 의심이 먼저 들었습니다. 실제로 라마(LLaMA) 같은 비교적 단순한 오픈소스 모델에서 검증된 결과이기 때문에, 프론티어 모델 전체에 드롭인(Drop-in) 방식으로 적용될지는 아직 미지수입니다.

터보퀀트가 가져오는 변화를 정리하면 다음과 같습니다.

KV캐시 메모리 사용량을 최대 16분의 1로 압축
컨텍스트 윈도우(Context Window, AI가 한 번에 처리할 수 있는 대화 길이)를 4~8배 확장
GPU 연산 효율 극대화로 기존 하드웨어에서 더 많은 처리량 확보
별도 하드웨어 교체 없이 소프트웨어 업데이트만으로 적용 가능

재본스역설, 싸지면 더 쓴다는 게 역사적으로 맞는 말인가

저도 처음엔 단순하게 생각했습니다. 메모리 요구량이 16분의 1로 줄면 데이터센터가 그만큼 덜 사는 것 아닌가? 하이닉스랑 삼성전자한테는 악재 아닌가? 그런데 직접 겪어보니 이런 식의 선형적 추론이 시장에서 얼마나 자주 틀리는지 알게 됐습니다.

여기서 등장하는 개념이 재본스 역설(Jevons Paradox)입니다. 재본스 역설이란 자원 효율이 개선되면 오히려 그 자원의 총 소비량이 늘어난다는 경제 법칙으로, 19세기 영국 경제학자 윌리엄 스탠리 재본스가 석탄 소비를 분석하며 처음 제시했습니다. 압축 기술이 나왔다고 메모리를 덜 쓰는 게 아니라, 비용이 내려가니까 더 복잡한 작업에 더 많이 쓰게 된다는 논리입니다.

역사적 사례가 이를 뒷받침합니다. MP3 압축 기술이 나왔을 때 음원 저장 공간이 줄어들자 사람들은 음원을 덜 저장한 게 아니라 더 많이 모았습니다. 카카오톡이 문자를 공짜로 만들자, 30원짜리 문자를 아끼던 사람들이 "ㅋㅋㅋ" 하나에도 메시지를 보내기 시작했습니다. 비용이 100분의 1로 내려가면 사용량이 그보다 훨씬 많이 늘어납니다. 이게 기술 혁신이 시장을 키워온 방식입니다.

다만 저는 이 논리를 HBM(High Bandwidth Memory) 시장에 그대로 적용하는 데는 한 발짝 신중해야 한다고 봅니다. HBM이란 GPU와 메모리를 수직으로 쌓아 초고속 데이터 전송이 가능하도록 만든 고대역폭 메모리로, AI 연산의 핵심 부품입니다. 문자나 MP3 같은 소비재는 한계비용이 사실상 0에 수렴하지만, HBM은 여전히 생산 캐파(Capacity)와 단가가 물리적으로 묶여 있습니다. 수요의 가격 탄력성이 실제로 얼마나 되는지는 분기 실적이 나와봐야 확인할 수 있는 문제입니다.

그래서 "싸지면 폭발적으로 쓴다"는 낙관론과 "알고리즘 효율화로 수요가 억제된다"는 비관론, 두 가지를 동시에 열어두고 지켜봐야 한다는 게 제 입장입니다.

멀티플이 낮아진다는 건 무슨 의미인가

이번 사태를 보면서 제가 가장 마음에 담아둔 건 기술 이야기가 아니라 밸류에이션 차트였습니다. 코스피, SK하이닉스, 마이크론 모두 이익이 증가하는 속도를 주가가 따라가지 못하고 있다는 그래프입니다. 악재 뉴스가 뜰 때마다 손절 버튼에 손이 갔던 제 경험을 돌이켜보면, 저는 항상 멀티플만 쫓았지 이익의 방향을 제대로 본 적이 없었습니다.

여기서 PER(주가수익비율)이란 현재 주가를 주당순이익으로 나눈 값으로, 투자자들이 이 기업의 이익 1원에 얼마를 지불할 의향이 있는지를 나타내는 밸류에이션 지표입니다. PER이 낮아진다는 건 이익은 늘고 있는데 주가가 그만큼 오르지 않았다는 의미입니다. 마이크론은 최근 분기 실적 발표에서 시장 예상을 웃도는 성과를 내놨음에도 주가가 부진했는데, 이는 시장이 미래 수요의 구조적 둔화를 이미 선반영하고 있다는 해석도 가능합니다.

반도체 업종의 밸류에이션 흐름은 MSCI 지수 분류 기준에서도 확인할 수 있는데, 글로벌 AI 투자 사이클 속에서 메모리 업체들의 멀티플 하락이 동시에 진행되고 있다는 점은 단순한 악재 하나로 설명하기 어렵습니다(출처: MSCI). 실제로 반도체 수요 전망과 관련해 미국 반도체산업협회(SIA)는 2025년 글로벌 반도체 매출 성장을 전망하면서도 메모리 부문의 공급 과잉 리스크를 별도로 언급한 바 있습니다(출처: 미국 반도체산업협회(SIA)).

제 경험상 이런 구간에서 가장 위험한 건 뉴스 한 줄에 흔들리는 것보다 이익이 실제로 꺾이는 타이밍을 놓치는 것이었습니다. "싸 보인다"는 느낌과 "실제로 기회다"는 판단은 다른 문제입니다. 터보퀀트 이슈가 진짜 메모리 수요를 구조적으로 바꾸는지, 아니면 일시적인 공포에 그치는지는 앞으로 2~3분기 실적으로 확인해야 합니다.

앞으로 저도 헤드라인이 주는 공포보다 이익의 방향을 먼저 확인하는 습관을 들이려고 합니다. 압축 기술이 혁신인 건 맞지만, 그게 메모리 시장을 죽이는지 키우는지는 재본스 역설의 역사가 이미 방향을 가리키고 있습니다. 다만 어느 쪽으로든 단정 짓기보다 분기 실적이라는 팩트로 검증하는 과정이 반드시 필요합니다. 투자 판단은 이 글의 분석이 아니라 본인의 기준과 전문가 조언을 바탕으로 하시길 권합니다. 이 글은 개인적인 경험과 의견을 공유한 것이며, 전문적인 투자 조언이 아닙니다.

참고: https://youtu.be/JYOW_MWJQIw?si=rpWRcX3H1Uuqhu40

티스토리 뷰

터보퀀트와 메모리 수요 (KV캐시, 재본스역설, 밸류에이션)

KV캐시와 터보퀀트, 뭐가 달라진 건가

재본스역설, 싸지면 더 쓴다는 게 역사적으로 맞는 말인가

멀티플이 낮아진다는 건 무슨 의미인가

티스토리툴바