입력 : 2014-09-19 18:19:32
IT 기술의 핵심은 ‘기술의 진화’에 있다. 꾸준히 새로운 기술이 공개되고 적용되면서 높은 성능 향상과 효율을 보이고 있는 지금, 흐름에 뒤쳐지면 자연스레 도태되고 결국 역사 속으로 사라지게 된다. 진화론적으로 접근한다면 IT 세계는 매우 치열하고 빠르게 진행되고 있는 생태계가 아닐까?
그래픽 기술의 진화도 마찬가지다. 창의적인 콘텐츠도 중요하지만 이를 제대로 표현하기 위한 가속 기술도 중요하다. 이를 위해 지금까지 수많은 그래픽 프로세서 개발사가 뛰어들었고 현재 엔비디아와 AMD가 남아 치열한 혈투를 이어가고 있다. (인텔은 예외로 한다.)
두 제조사는 서로 새로운 기술을 발표하고 성능을 높이며 계속 경쟁했다. 특히 엔비디아의 케플러(Kepler) 아키텍처와 AMD의 GCN(Graphics Core Next) 아키텍처간의 대결은 인상적이었다. 그리고 잠시 숨을 고르는가 싶더니, 엔비디아가 차세대 아키텍처인 맥스웰(Maxwell)을 꺼내들며 반격에 나섰다.
처음 맥스웰은 시장의 많은 기대를 받았지만 새로운 아키텍처는 플래그십에 적용된다는 법칙을 깨고 2014년 2월, 보급형 라인업으로 먼저 출시가 이뤄졌다. 지포스 GTX 750/750 Ti가 대표적이다. 이후 7개월, 길다면 길고 짧다면 짧은 시간이 흘렀고 엔비디아는 드디어 빵빵한 성능으로 무장한 맥스웰을 들고 우리 앞에 섰다.
▲ 기다리던 진짜 맥스웰 아키텍처가 모습을 드러냈다.
● 케플러 아키텍처의 뒤를 잇는 맥스웰 아키텍처
지포스 GTX 980이 등장하기 전, 두 세대(GTX 600 / 700)는 케플러(Kepler) 아키텍처를 적용해 쓰고 있었다. 등장 당시, 기존 페르미(Fermi) 아키텍처 대비 향상된 효율과 성능, 낮은 전력소모를 앞세우며 시장에서 폭발적인 성공을 거뒀다. 그리고 한 시대를 주름잡던 아키텍처는 기술의 발전에 의해 역사의 뒤안길로 접어들고 있다. 케플러와 맥스웰 아키텍처의 차이는 무엇인지 간단히 짚고 넘어가자. 더 자세한 내용은 별도의 기사를 통해 소개할 예정이다.
▲ 케플러의 SMX(좌)와 맥스웰의 SMM(우). 기본적인 구조부터 코어의 수에 이르기까지 많은 변화가 있음을 알 수 있다.
맥스웰 아키텍처의 핵심은 쿠다 코어(CUDA Core)를 묶는 제어 로직(Control Logic)의 변화다. 기존 케플러는 하나의 제어 로직이 192개의 쿠다 코어를 제어하는 방식이었다. 반면, 맥스웰에서는 이를 4개로 나눠 구성했다. 한 개의 제어 로직에는 32개의 쿠다 코어가 배치된다.
1개의 제어 로직에는 32개의 쿠다 코어와 함께 명령 버퍼와 워프 스케쥴러, 처리 유닛 2개, 래지스터 파일(1만 6,384 x 32비트), 8개의 실행/저장 유닛, 8개의 특별 기능 유닛(SFU)으로 구성된다. 케플러 아키텍처와 비교하면 더 세밀하고 정밀하게 구성되어 있음을 알 수 있다. 이를 통해 전체 프로세서의 수는 2/3으로 줄어들었지만 효율은 높일 수 있다.
이 같은 구성의 장점은 단연 배정밀도(DP) 연산일 것이다. 과거 케플러는 SMX를 통해 병렬 컴퓨팅 연산을 하기 때문에 쿠다코어의 수가 적으면 이에 대한 성능도 낮을 수 밖에 없었다. 실제로 GTX 타이탄 또는 GTX 780 Ti의 등장 이전에는 단순 배정밀도 연산으로 경쟁사의 그래픽카드를 앞설 수 없었다.
그러나 병렬 컴퓨팅 처리를 위한 제어 로직의 수를 늘리면서 자연스레 배정밀도 연산 기능이 향상되는 결과를 얻을 수 있다. 전반적인 틀은 케플러 아키텍처와 다를게 없지만 캐시의 배치와 용량이 증가한 것도 기대감을 갖게 만드는 부분.
▲ 맥스웰 아키텍처가 적용된 지포스 GTX 980의 코어 다이어그램.
맥스웰 아키텍처가 적용된 지포스 GTX 980의 내부 모습. 자세히 살펴보면, 전체 2,048개의 쿠다 코어를 보유하고 있고 세부적으로 페르미 아키텍처를 통해 처음 적용된 그래픽 프로세싱 클러스터(GPU)가 4개, 맥스웰 스트리밍 프로세서(SMM)가 16개가 된다. 제어 로직은 64개. 4+4+4+4 구성을 띈다.
이 구조에서 3개의 SMM이 제외된 구성이 지포스 GTX 970이다. 1,664개의 쿠다코어 13개의 SMM으로 구성된다. 하지만 4개의 GPC 속에 4개의 SMM이 구성되는 방식에서 4+4+4+1 구조는 의미가 없다. 이런 이유에서 GTX 970은 GPC/SMM 구성이 4+3+3+3이 될 가능성이 높다.
● 맥스웰 아키텍처 품은 고성능 그래픽카드 ‘기가바이트 GTX 980 SOC G1 게이밍’
이제 새로운 아키텍처의 시대가 열렸다. 차세대 그래픽 프로세서가 과거를 주름잡던 그래픽 프로세서를 밀어내고 세대교체를 준비하고 있는 것. 엔비디아는 차세대 그래픽 프로세서의 아키텍처로 맥스웰을 제안했다. 맥스웰은 처음 지포스 GTX 750/750 Ti 등 보급형 라인업에 처음 적용되다 드디어 고성능 라인업에 본격 채용됐다.
기가바이트 지포스 GTX 980 SOC G1 게이밍은 이 거대한 맥스웰 프로세서가 적용된 그래픽카드로 차세대 기술과 함께 다양한 특징을 소비자에게 제공하고 있다는 점이 특징이다.
▲ 새로운 윈드포스 냉각 시스템과 엄선된 부품을 적용한 기가바이트 GTX 980 G1 게이밍
제이씨현시스템을 통해 국내 판매될 이 제품은 처음부터 기가바이트의 고급 기술을 적용해 성능을 높였다. 지포스 GTX 980의 기본 작동속도가 1,126MHz인데 비해 1,228MHz로 8% 가량 속도를 높여 동급 제품보다 빠른 3D 가속 성능을 맛볼 수 있다. 상황에 따라 속도를 높이는 GPU 부스트(Boost) 속도 역시 1,216MHz에서 1,329MHz로 9% 상승했다.
이것이 가능한 이유는 바로 기가바이트 자체 기술인 울트라 듀러블 그래픽카드(UDV) 디자인에 있다. 그래픽 프로세서를 선별하는 과정에서 특별히 수율이 좋은 칩을 골라 제품에 탑재하면서 기본 성능 및 오버클럭 성능까지 고려했다.
▲ 2,046개 쿠다 코어를 품은 GM204 그래픽 프로세서. 이 그래픽카드의 핵심 중 하나다.
기가바이트 지포스 GTX 980 SOC G1 게이밍의 그래픽 프로세서는 GM204의 코드명을 갖는 칩으로 맥스웰 아키텍처가 적용된 따끈따끈한 녀석이다. 52억개의 트랜지스터를 작은 칩 안에 집적했다. 이는 인텔 프로세서에 집적된 것보다 적게는 2배, 많게는 3배 이상 많은 수다. 두 칩을 고스란히 비교하는 것은 어렵지만 그만큼 그래픽 프로세서가 하는 역할과 기술은 CPU의 그것을 어느 정도 뛰어 넘었다고 봐도 될 듯 하다. 공정은 28 나노미터다.
기본 작동속도는 1,126MHz지만 이 칩은 기가바이트에 의해 공장 오버클럭(Factory Overclocking)이 되어 있다. 속도는 1,228MHz. 8% 가량 속도가 올랐다. 오버율에 따라 성능이 비례하게 올라가지 않지만 게임에서 1프레임이라도 더 빠른 성능을 경험하려면 제조사가 보증하는 오버클럭은 한 줄기 빛과도 같다.
새로운 그래픽 프로세서는 마이크로소프트의 다이렉트엑스(DirectX) 12를 지원한다. 현재 11이 폭넓게 쓰이고 있는데, 새로운 버전은 다양한 신기술이 적용되기도 했지만 가속에 필요한 자원을 효율적으로 관리하는데 초점을 맞추고 있다.
▲ 256비트(bit) 인터페이스, 총 4기가바이트(GB) 용량으로 구성된 GDDR5 메모리.
메모리는 이전 세대와 마찬가지로 GDDR5 규격을 쓴다. 작동속도는 7Gbps(1,750MHz)로 빠르게 작동하고 있어 기가바이트에서 별도로 오버클럭 하지 않았다. 물론 필요에 따라 소비자가 직접 애플리케이션을 통해 오버클럭을 할 수 있지만 그에 따른 책임은 소비자에게 있음을 인지할 필요가 있을 것이다.
인터페이스는 256bit 구성으로 GTX 780 Ti 계열보다 GTX 770 또는 GTX 680과 같은 구성이다. 상위 라인업은 384bit 인터페이스로 구성되어 있다. 향후 GTX 980 Ti 또는 그 이상급 제품에서는 더 많은 메모리 인터페이스가 제공될 가능성이 존재한다.
용량은 총 4GB로 이전 제품의 2~3GB 대비 1GB 늘었다. 메모리 용량이 늘어날수록 다양한 데이터를 처리하기에 유리한 점이 있다. 고해상도 영역에서의 성능은 용량보다 인터페이스에 따라 나뉘는 성향이 있는데 256bit만 하더라도 어느 정도는 성능을 낼 수 있을 것으로 전망된다. 맥스웰 아키텍처에는 메모리를 효율적으로 관리하기 위한 압축 알고리즘이 적용됐기 때문이다.
▲ 여유로운 전원부 구성으로 오버클럭에 유리하도록 설계했다.
기가바이트 지포스 GTX 980 SOC G1 게이밍이 기본형 GTX 980과 다른 점은 전원부에 있다. 기본형은 5단계(4+1)로 전원부를 구성하고 있는 형태지만 이 제품에서는 총 8단계로 구성해 그래픽 프로세서와 메모리 등에 전력을 안정적으로 공급하도록 했다. 6+2 구조로 추측 되는데 기존 성능 이상의 오버클럭을 시도하고자 하는 소비자에게 이상적인 성능을 보일 것으로 보인다.
보조전원 커넥터의 구성도 다르다. 기본형은 6+6핀 구조이지만 여기에서는 8+8핀 구조다. 그래픽 프로세서의 열 설계 전력(TDP)가 165W라는 점을 감안하면 더 많은 전력공급을 통해 성능을 높이도록 지원하는 구성이다.
▲ 새로운 냉각팬 적용으로 공기 흐름을 개선하고 냉각 성능을 높인 윈드포스 600W 쿨러.
속도를 겨냥했기 때문에 냉각 솔루션 또한 변화가 있었다. 기가바이트는 과거 윈드포스(Windforce) 시스템 도입으로 시장에서 좋은 반응을 얻은 바 있다. 이후 꾸준한 기술을 도입하기 시작했고 GTX 980에 와서는 지금에 이르렀다. 윈드포스 600W라는 이름을 쓰는 이 쿨러는 뛰어난 효율과 성능을 갖췄다.
먼저 냉각팬의 디자인을 변경하면서 공기의 흐름을 높였다. 기존 윈드포스 냉각팬과 비교해 약 23% 가량 흐름을 개선해 방열핀의 열을 쉽게 방출 가능해졌다. 방열판을 구성하는 알루미늄 히트싱크와 구리 히트파이프도 달라졌다. 압축 알루미늄 히트싱크 적용 및 방열핀 디자인을 바꿔 공기 접촉 면적을 늘렸고 구리 베이스와 히트파이프는 수를 늘려 열 전도율을 높였다.
한 개의 냉각팬은 방열핀을 훑고 전원부 아래로 흘러가도록 설계 했지만 나머지 두 개의 냉각팬은 구리 베이스와 방열핀 사이를 통해 공기가 유입되도록 했다. 공기의 흐름이 삼각형 형태를 띄어 기가바이트는 이를 트라이앵글 쿨(Triangle Cool)이라고 이름 붙였다.
▲ 총 6개의 영상 출력 단자는 다양한 영상 장치를 지원할 수 있다.
DVI-D, DVI-I 외에도 3개의 디스플레이 포트(DP), HDMI 등 이 그래픽카드에서는 총 6개의 영상 출력단자가 제공된다. 다양한 영상 장치를 지원하기 위함인데, 기가바이트는 별도로 플렉스 디스플레이 기술(FLEX DISPLAY Technology)를 적용해 구형 모니터와 최신 모니터에 이르기까지 호환의 폭을 넓힌게 특징이다.
이는 여러 모니터를 연결할 때 이점이 있다. 과거 그래픽카드는 일부만 고해상도를 지원하고 타 제품은 그렇지 않은 경우가 있었다. 4K(3,840 x 2,160) 해상도를 지원하는 모니터는 더 심하다. 그러나 플렉스 디스플레이 기술을 통해 호환성에 대한 스트레스 없이 유연하게 대처할 수 있다.
● 게이밍 스펙트럼 넓혀줄 차세대 그래픽카드
다양한 신기술로 무장한 맥스웰 아키텍처, 그것을 적용한 그래픽 프로세서를 품은 기가바이트 지포스 GTX 980 SOC G1 게이밍. 존재 그 자체만으로도 게이밍 환경을 바꿔줄 차세대 그래픽카드라는 점은 변함 없지만 이 제품은 변화하는 환경 속에서도 최고의 성능을 경험하게 해 줄 능력을 품었다. 더 빠른 작동속도와 여유 넘치는 냉각 시스템 등 까다로운 입맛의 게이머 입장에서 바라보면 매력 덩어리다.
전체적인 밸런스는 케플러 아키텍처 시절보다 더 낫다고 평가된다. 두 세대 이전인 GTX 680도 충격적이지만 GTX 980 역시 신선하기 때문. 우선 전력 소모에 대한 부분이다. GTX 680이 처음 발표할 때의 열 설계 전력(TDP)는 195W, 980은 165W로 줄었다. 15% 가량 낮춘 것이다. 칩 면적이 달라 직접 비교는 어렵지만 GTX 780의 TDP는 이보다 더 많은 250W였다. 메모리 용량을 늘리고 전력 대 처리 성능을 두 배 가량 높였으니 놀라운 부분.
성능과 효율성이라는 난제를 풀어가며 차세대 게이밍 환경에 한 발 다가간 지포스 GTX 980. 이 잠재력을 더 끌어 올린 기가바이트 지포스 GTX 980 SOC G1 게이밍은 차세대 하이엔드 그래픽카드를 기다린 게이머에게 어울리는 선물이 아닐까?
베타뉴스 강형석 (kanghs@betanews.net)
Copyrights ⓒ BetaNews.net
-
- 목록
- 위로