기획기사

다이렉트X 11에 맞춘 차세대 GPU 엔비디아 ‘GF100’ 엿보기 - 1/2


  • 방일도
    • 기사
    • 프린트하기
    • 크게
    • 작게

    입력 : 2010-01-18 19:43:38

    DX11 천하 평정을 노리는 엔비디아의 비밀병기, GF100


    엔비디아는 지포스 8800 GTX를 선보이며 다이렉트X 10 시대로 향하는 문을 열었다. 그렇지만 3년이 조금 더 지난 지금까지도 다이렉트X 11 기반 제품은 아직 내놓지 않고 있다.

     

    이와 달리 경쟁사인 AMD는 다이렉트X 11 기반의 그래픽 제품군을 착실히 내놓고 있다. 상위 제품인 라데온 HD 5800 시리즈를 시작으로 라데온 HD 5700 시리즈, 그리고 최근 발표한 라데온 HD 5600 시리즈까지 착실하게 라인업을 갖춤으로써 일단 우위를 점하는 데에 성공했다. 속된 말로 ‘선빵’을 제대로 날린 셈이다.

     

    그렇다고 해서 엔비디아가 승부에서 패했다고 속단하는 것은 옳지 않다. 아직까지 승부를 가르는 결정타는 없었으니 말이다. 아니, 정확하게 말해서 아직 시작하지도 않았다고 보는 쪽이 맞다. 청코너에 선수가 올라간 것만 보고 홍코너 선수가 질 것이라고 생각하는 것은 우스운 일 아니겠는가. 홍코너 선수를 보지도 않고 말이다.

     

     

    엔비디아는 현재 비밀 병기인 GF100(코드명)을 숨겨두고 있다. 3월 많은 이들의 기대보다 다소 출시가 늦어져 불만을 사고 있지만 이 말은 곧 바꿔 말하면 그만큼 GF100에 거는 기대가 크다는 소리나 다름없다.

     

    경쟁사를 완벽하게 앞서기 위해 신중을 기하는 엔비디아의 입장을 이해하지 못하는 것은 아니지만 해당 제품을 기다리는 이들에게는 답답한 노릇일 따름이다. 경쟁 제품은 이미 네 달 전에 나왔는데 이에 반해 GF100에 대한 소식은 그리 많지 않으니 말이다. 대체 얼마나 빠른 것인지, 과연 기다릴 만한 가치가 있는 것인지 슬슬 고민될 시기이기도 하다.

     

    이러한 이들을 위해 베타뉴스가 엔비디아 GF100에 대한 따끈따끈한 소식들을 전하려 한다. 과연 엔비디아 GF100은 어떤 특징을 가지고 있는지, 그 성능은 어느 정도인지, 차별화 된 요소는 무엇인지 기사를 통해 알아보도록 하자.

    지포스 시리즈로 살펴보는 3D 그래픽 카드의 변천사


    PC가 표현하는 3차원 영상은 날이 갈수록 현실과 닮은 모습을 보여준다. 이 말은 곧 그래픽 카드가 꾸준히 발전했다는 말과 일맥상통한다.

     

    처음엔 단순한 흑백 글자를 표현하는 수준에 불과했던 그래픽 카드는 어느 순간 색을 다룰 수 있게 되었으며 해상도 또한 점차 높아졌다.

     

    우리가 흔히 그래픽 카드를 말할 때 쓰는 VGA(Video Graphic Array)는 사실 640x480 해상도 기준으로 16색상을 표시하는 수준에 불과한 성능을 가진 그래픽 카드에 불과하다. 그럼에도 당시엔 상당한 기술로 받아들여졌으며 그래픽 카드를 통칭하는 말로 당당하게 자리 잡았다.

     

    그 다음 그래픽 카드의 혁명을 꼽으라면 3D 가속 기능이 추가된 것을 들 수 있다. 3D 그래픽 처리 기능은 처음엔 부가 요소처럼 여겨졌지만 현재는 그래픽 카드에서 빼놓을 수 없는 필수 요소가 됐다.

     

    3D 시대에 적응하지 못하고 사라져 간 VGA 제조사도 많고 3D 그래픽 카드 시장에 도전했다가 이제는 잊혀진 이름이 된 업체도 적지 않다. 현재는 엔비디아와 AMD의 2강 체제로 굳어진 상태다.

     

    엔비디아는 3Dfx, 에이지아(Aegia) 등 굵직한 업체들을 인수하는 동시에 성능을 개선한 지포스 시리즈를 꾸준히 내놓으며 3D 그래픽 카드의 대표 브랜드로 확실하게 자리매김하게 된다.

     

    엔비디아 그래픽 제품군의 발전만 슬쩍 살펴봐도 3D 그래픽 카드의 변천사가 보인다. 과연 엔비디아 지포스 시리즈는 어떻게 변화되어 왔을까.

     

    1993년 첫 3D 그래픽 가속 칩인 NV1을 시작으로 그래픽 카드 시장에 뛰어든 엔비디아는 128비트 하드웨어 폴리곤 엔진을 쓰고 오픈GL에서 강세를 보인 리바 128로 자리를 잡기 시작했다.

     

    이후 리바 TNT(TwiN Texel) 시리즈로 높은 인기를 구가하게 된 엔비디아는 이를 바탕으로 강력한 성능을 가진 지포스 제품군을 세상에 선보이게 된다.

     

    1999년 출시된 지포스 256(NV10)은 하드웨어 T&L(Transform and Lighting)을 지원해 3D 그래픽 카드 시장에 돌풍을 일으켰다. CPU에 의존하지 않고도 폴리곤 변환 및 광원 처리를 하도록 만든 지포스 256은 그래픽 프로세싱 유닛(GPU, Graphic Processing Unit)의 시대를 새롭게 열었다. 지포스 256은 다이렉트X 7.0과 발맞춰 오늘날 3D 그래픽 환경의 기틀을 마련했다.

     

    2000년엔 2세대 T&L 엔진을 적용한 지포스 2(NV15) 제품군을 출시한다. 특히 지포스 2 GTS의 경우 그 이름처럼 1초에 1.6기가텍셀의 텍스처 필레이트 처리 능력을 갖춰 크게 주목 받았다.

     

    2000년 말 엔비디아는 새로운 그래픽 시대에 적응하지 못하고 나가떨어진 3Dfx를 인수해 큰 화제를 모았다. 뒤이어 2001년 초엔 다이렉트X 8에 맞춘 첫 그래픽 프로세서인 지포스 3(NV20) 시리즈를 선보인다. 프로그래밍이 가능한 쉐이더 엔진을 갖춘 지포스 3는 DX8과 호흡을 맞추며 프로그래머블 쉐이딩 시대를 열었다. 2002년엔 더욱 강력한 성능을 갖춘 지포스 4 Ti(NV25) 시리즈를 추가로 선보이며 DX8 시대를 멋지게 마감한다.

     

    이어 엔비디아는 다이렉트X 9에 맞춰 2003년 쉐이더 모델 2.0을 지원하는 지포스 FX 시리즈(NV30)를 출시한다. 픽셀 쉐이더의 성능을 크게 올린 지포스 FX 시리즈는 128비트 랜더링, 32비트 실수 연산으로 보다 실감나는 3D 그래픽을 구현했지만 아쉽게도 기존 제품들처럼 큰 인기를 얻진 못했다.

     

    그렇지만 엔비디아는 이에 굴하지 않고 곧바로 2004년 쉐이더 모델 3.0을 지원하는 지포스 6 시리즈(NV40)로 다시금 시장 상황을 뒤집는다. 지포스 6 시리즈는 HDR(High Dynamic Range)로 더욱 생생한 라이팅 효과를 표현하는 것은 물론 부두 2 시절을 연상케 하는 SLI(Scalable Link Interface)를 선보이며 다중 GPU 연동 기술의 뛰어난 성능을 뽐냈다.

     

    2005년엔 지포스 7(NV47) 시리즈를 선보이며 다이렉트X 9 시대의 마무리를 짓는다. 성능 향상은 물론 새로운 안티 애일리어싱 방식인 TSAA와 TMAA를 추가하는 등 화질 개선도 함께 꾀했다.

     

    드디어 2006년 11월엔 길었던 다이렉트X 9 시대가 끝나고 다이렉트X 10 시대로 접어들게 됐다. 첫 다이렉트X 10 기반 그래픽 카드인 지포스 8(G80) 시리즈는 픽셀 쉐이더와 버텍스 쉐이더를 나누던 기존 세대 GPU와 달리 필요에 따라 연산을 나누어 처리하는 강력하고 효율적인 통합 쉐이더 디자인을 내세웠다. 또 쿠다(CUDA, Compute Unified Device Architecture)를 통해 GPU 컴퓨팅의 시대를 열기도 했다.

     

    이후 엔비디아는 지포스 9 시리즈 및 지포스 200 시리즈 등을 내놓으며 다이렉트X 10 기반 그래픽 시장을 이끌어 왔다.

     

    이제 다이렉트X 11로 넘어갈 차례다. GF100이 바로 그 역할을 맡는다. GF100은 다이렉트X 11을 완벽하게 지원한다. GF100에 대해 알면 다이렉트X 11이 어떻게 바뀌었는지도 알 수 있다는 소리다.

     

     

    엔비디아 GF100, 과연 어떤 점이 다른가?

    엔비디아가 선보일 예정인 최신 GPU의 코드명은 GF100이다. 이 제품은 페르미(Fermi) 아키텍처에 기반한 첫 GPU다. 머지 않아 출시될 이 GPU는 기존의 3D 그래픽 처리 성능을 뛰어넘는 성능을 보여준다.

     

    그렇다면 GF100은 기존 세대 그래픽 제품군과 비교해 대체 어떤 점이 나은 것일까. 엔비디아가 GF100에서 추구하는 디자인 철학은 크게 네 가지를 꼽을 수 있다. 지오메트릭 리얼리즘, 더욱 뛰어난 영상 품질, 게임에 최적화 된 GPU 컴퓨팅, 기존 세대를 뛰어넘는 강력한 성능이다.

     

    아마도 많은 이들이 GF100의 정확한 제원에 대해 궁금해 할 것이다. 아쉽게도 GF100의 정확한 코어 작동 속도 등은 아직까지 확실하게 정해지지 않은 상태라는 점을 미리 말해둔다.

     

    먼저 GF100의 블록 다이어그램을 간단하게 살펴보자.

     

    ▲ GF100의 블록 다이어그램

     

    GF100은 512개의 쿠다 코어를 가지고 있으며 16개의 지오메트리 유닛, 래스터 유닛 4개, 64개의 텍스처 유닛, ROP 유닛 48개로 구성된다. 메모리의 경우 384비트 GDDR5 메모리를 쓴다. 기존 GPU에서 일부 병목 현상이 발생하는 부분을 개선한 구조가 눈에 띈다.

     

    특히 지오메트리 성능 및 GPU 컴퓨팅 처리 쪽에서 더욱 효율적인 모습을 보여준다. 나중에 이에 대해 다시 언급할 예정이다.

    GF100의 가장 큰 무기는 뛰어난 ‘테셀레이션’ 성능

    요즘 그래픽 카드의 쉐이더 성능은 상당히 뛰어난 편이다. 쉽게 말해 3차원으로 그려낸 형태 표면에 덧씌워 더욱 입체감 있게 만드는 재주가 있다는 소리다. 이에 반해 근본적인 3차원 틀을 빚어내는 지오메트리(Geometry, 기하학) 성능은 크게 나아지지 않았다.

     

    지포스 FX 5800부터 지포스 GTX 285까지 진화를 거듭하며 쉐이더 성능은 무려 150배 이상 올랐다. 그렇지만 지오메트리 성능 향상은 채 3배도 되지 않는 수준에 불과하다. 쉽게 설명하자면 얼굴을 요모조모 뜯어고치는 대공사 대신 화장발로 커버하는 방법을 써 온 것이다.

     

    이는 단순히 하드웨어 성능이 부족했기 때문만은 아니다. API 역시 이를 제대로 지원하지 못했다. 다이렉트X 9도, 다이렉트X 10도 결코 이러한 불만을 속 시원히 해결해 줄 수 있는 환경을 제공해 주진 못했다.

     

    GF100은 새로운 지오메트리 연산 구조를 가짐으로써 8배의 성능 향상을 이뤘다. 일단 더욱 효율적인 하드웨어 구조를 가지고 있기 때문이며 여기에 다이렉트X 11이라는 새로운 API가 뒷받침을 해 줬기에 이와 같은 성능 향상이 가능한 것이다.

     

    정교한 3차원 그래픽을 표현하려면 어떻게 해야 할까. 가장 단순한 방법은 폴리곤 숫자를 늘리는 것이다. 그렇지만 더 나은 3차원 영상을 만들겠다고 폴리곤 숫자를 기하급수적으로 늘리게 되면 결국은 심각한 부하에 직면할 수 밖에 없다.

     

    때문에 이처럼 비효율적인 방법보다는 효율적인 방법을 쓰는 쪽이 성능 면에서 훨씬 낫다. 테셀레이션(Tessellation, 쪽매맞춤)이 바로 이러한 역할을 한다. 다이렉트X 11에선 테셀레이션과 위치변환 매핑(Displacement mapping)으로 효율적인 메트리 성능 향상을 꾀했다.

     

    ▲ 테셀레이션은 효율적인 지오메트리 표현을 가능케 한다

     

    테셀레이션은 어떤 것일까. 쉽게 말해서 기본적인 형태를 주면 하드웨어가 이를 알아서 계산해 세밀한 폴리곤으로 채워넣는 방식이라 할 수 있다. 위치변환 매핑으로 간단한 틀을 잡아주고 여기에 테셀레이트로 하드웨어 처리 가능 수준에 맞춰 잘게 채워넣음으로써 세부 묘사를 꾀하게 된다.

     

    기존엔 단순한 표면에 음영이 있는 텍스처를 씌워 요철이 있는 것처럼 눈속임을 하는 범프 매핑(Bump mapping)이라는 편법을 주로 썼다. 그렇지만 테셀레이션을 적용하게 되면 실제로 요철이 생겨나게 된다.

     

    ▲ 테셀레이션을 적용하면 입체감이 더욱 살아나게 된다

     

    고품질의 결과물을 보여주면서도 높은 초당 프레임 수치를 낸다는 점 또한 테셀레이션의 장점이다. 최소한의 자원으로 최대한의 결과물을 그려낼 수 있게 한 덕이다.

     

    테셀레이션이 적용되면 좋은 점이 또 있다. 3차원 그래픽을 처리할 때 더욱 융통성을 갖게 된다는 점이다. 기본 제공되는 위치변환 맵을 기반으로 고성능 그래픽 카드에선 더욱 세밀한 표현을, 성능이 상대적으로 떨어지는 보급형 그래픽 카드에선 비교적 단순한 형태로 3차원 객체를 만들어 낸다.

     

    ▲ 테셀레이션은 적용 수준에 따라 천차만별의 화면을 보여준다

     

    덕분에 개발자들이 두 가지 극단적인 환경을 위해 따로 개발을 할 필요가 없다. 사용자 또한 자기 시스템 수준에 맞춰 게임을 즐길 수 있게 된다. 고성능 그래픽 카드를 가진 사람은 멋진 그래픽을 즐길 수 있어서 좋고, 보급형 그래픽 카드를 가진 사람은 다소 밋밋하지만 최신 게임을 비교적 쾌적한 속도로 게임을 즐길 수 있어서 좋다.

     

    다이렉트X 11에서 테셀레이션 처리는 어떻게 이루어지나?

    다이렉트X 11은 공식적으로 테셀레이션을 지원한다. 테셀레이션을 위해 버텍스 쉐이더와 지오메트리 쉐이더 사이에 세 가지 요소를 추가했다. 헐 쉐이더(Hull Shader)와 테셀레이터(Tessellator), 그리고 도메인 쉐이더(Domain Shader)다.

     

    ▲ DX11 파이프라인엔 테셀레이션을 위한 3단계가 추가됐다

     

    헐 쉐이더는 선확장(Pre-expansion)을 수행한다. 버텍스 쉐이더가 넘겨준 자료를 토대로 컨트롤 포인트를 잡는다. 이를 도메인 쉐이더가 후확장(Post-expansion) 처리한다. 도메인 쉐이더는 (u, v) 좌표로 구성된 맵을 (x, y, z, w)로 재구성한다. 테셀레이터는 삼각형과 선으로 이를 얼마나 세밀하게(LOD, Level of Detail) 채울 것인지 결정한다.

     

    ▲ 테셀레이션과 지오메트리 쉐이딩, 컴퓨트 기술을 고루 쓰면 이와 같은 표현이 가능

     

    엔비디아는 수면 및 여성의 머리카락을 표현한 데모를 통해 테셀레이션으로 인한 성능 및 품질 차이를 내세웠다. 머리카락의 흔들림을 표현한 데모의 경우 테셀레이션과 지오메트리 쉐이딩, 그리고 다이렉트컴퓨트 기술이 고루 적용됐다.

     

    ▲ 기존 GT200의 블록 다이어그램. 지오메트리 처리에 부하가 걸릴 수 밖에 없는 구조다.

     

    여기서 잠깐 기존 세대 GPU인 GT200의 블록 다이어그램을 짚고 넘어가자. 해당 구조에서는 병목 현상이 발생하기 때문에 지오메트리 성능에 저하가 따를 수 밖에 없다. GPU의 각 코어들이 처리한 자료가 위쪽에 배치된 쉐이더 집합을 거쳐 다시 코어로 들어가는 구조이기 때문이다.

     

    GF100은 16개의 폴리모프 엔진과 4개의 래스터 엔진을 적재적소에 배치해 성능 효율을 끌어올렸다. 폴리모프 엔진은 버텍스 패치, 테셀레이터, 뷰포트 트랜스폼, 어트리뷰트 셋업, 스트림 출력단을 갖추고 있으며 전체(월드) 화면을 처리한다. 래스터 엔진은 순서대로 엣지(선) 설정, 래스터화, Z-컬 순으로 처리하며 표시되는 화면 단위로 처리한다.

     

    ▲ GF100은 지오메트리 처리에 효율적인 병렬 구조를 도입했다

     

    GF100은 병목 현상이 생길 수 밖에 없는 기존 구조 대신 지오메트리 병렬 처리를 극대화 시킬 수 있는 구조를 채택했다. 덕분에 GT200보다 8배 높은 지오메트리 성능을 가질 수 있게 됐다.

     

    GF100의 테셀레이션 및 지오메트리 성능은 어느 정도일까?

    엔비디아 측이 제시한 성능 측정 자료에 의하면 GF100은 상당히 뛰어난 테셀레이션 성능을 가진 것으로 보인다. 엔비디아 자체 테스트 기준으로 경쟁 제품보다 최소 2배에서 최대 6배 이상 뛰어난 테셀레이션 성능을 보인다고 한다.

     

    ▲ 엔비디아가 공개한 테셀레이션 성능 비교 표

     

    엔비디아의 성능 그래프를 보면 유니진(Unigine)사의 첫 DX11 벤치마크 소프트웨어인 헤븐(Heaven)에서도 GF100은 상당히 뛰어난 성능을 보여주는 것을 확인할 수 있다. 해당 테스트 표에 의하면 GF100은 경쟁 제품인 라데온 HD 5870보다 약 1.5~1.8배의 성능을 보인다.

     

    ▲ 엔비디아가 공개한 DX11 벤치마크 성능 비교 표

     

    GF100은 마이크로소프트 SDK 샘플을 통한 지오메트리 쉐이더 성능 측정에서도 경쟁 제품보다 4~4.7배 더 빠른 모습을 보여주는 것으로 알려졌다. 여기 나온 성능대로라면 GF100은 출시가 다소 늦어지더라도 충분히 용납될 만한 실력을 가진 것으로 보인다.

     

    ▲ 엔비디아가 공개한 지오메트리 쉐이더 성능 비교 표

     

    내용이 다소 길어진 탓에 이번 기사는 여기에서 마무리 하려 한다. 다음 기사에서는 GF100 프로세서의 구조, 개선된 안티 애일리어싱 효과, 게임을 위한 GPU 컴퓨트 기능 등에 대해 알아볼 예정이다.

     

    -> 2부 기사에서 계속

     

    다이렉트X 11에 맞춘 차세대 GPU 엔비디아 ‘GF100’ 엿보기 - 2/2
    http://www.betanews.net/article/484703


    베타뉴스 방일도 (idroom@betanews.net)
    Copyrights ⓒ BetaNews.net





    http://m.betanews.net/484430?rebuild=on