출처 : http://news.danawa.com/News_List_View.php?nModeC=1&nSeq=63841&sMode=review
1. 2008년 11월, 네할렘 모습을 드러내다
지난 2006년 7월, 코어마이크로 아키텍처를 적용한 '코어2 듀오' 프로세서가 출시됐을 때, 유저들의 반응은 가히 폭발적이었다. 획기적으로 변화된 아키텍처와 향상된 전력 효율성, 추가된 여러 가지 기능과 높은 오버클럭 수율까지...CPU시장은 바야흐로 '콘로' 열풍에 휩싸였다.
그리고 2년 4개월의 시간이 2008년 11월, 드디어 새로운 아키텍처를 적용한 CPU 네할렘이 세상에 모습을 드러냈다. 'i7'이라고 이름 붙여진 이번 프로세서는 지난 '코어2' 형제들의 높은 인기를 이어 프로세서 시장에서 인텔의 우위를 지켜줄 '차세대 전사'로서의 막중한 임무를 띄고 있다.

이번에 출시된 'i7'프로세서는 하이엔드 제품군인 '블룸필드(Bloomfield)' 3종으로 모두 쿼드코어이며, 제품명은 'i7 965 익스트림'과 'i7 940', 'i7 920' 등이다.
'i7' 프로세서는 총 3종류의 제품군으로 출시될 예정이다. 또 이번에 출시되는 '블룸필드' 외에도 메인스트림급 제품으로 쿼드코어 '린필드(Lynnfield)'가 2009년 3분기에, 그래픽코어를 내장한 듀얼코어 '하벤데일(Havendale)'이 2010년 1분기에 등장할 것으로 예상된다. 아직 이 제품들에 대한 정확한 모델명은 알려져 있지 않다.
다나와에서는 새롭게 바뀐 네할렘 아키텍처와 이들의 특징, 그리고 성능에 대해 앞으로 3부에 걸쳐 자세히 알아보는 시간을 갖는다. 그럼 먼저 이번 편에서는 i7 프로세서의 주요 특징에 대해 알아보도록 하겠다.
2. 네할렘, 어떤 점이 바뀌었을까?
1) 소켓 사이즈 변경 - 이제는 '1366'이다.
먼저 외형적으로 'i7'은 지금까지 사용하던 인텔 프로세서와 다른 모습을 보인다. 소켓 방식이 변화된 것이다. 인텔은 펜티엄4 시절부터 LGA775 소켓 방식을 사용해왔다. 그리고 이 방식은 'i7' 프로세서가 출시되기 전까지 계속해서 사용됨으로써 기존 메인보드를 사용하는 유저들도 별도의 업그레이드 없이 새로운 프로세서를 사용할 수 있는 폭넓은 호환성을 제공했다.
하지만 이번 '블룸필드'는 기존 775 방식 대신 LGA1366의 소켓 접점 방식을 선택함으로써 CPU의 전체적인 사이즈가 커졌다. 이렇게 소켓 방식이 바뀐 이유는 바로 아키텍처의 변경으로 인해 QPI와 메모리 컨트롤러가 내장돼 기존의 775 사이즈로는 이를 소화해낼 수 없었기 때문이다.
![]()
i7 965 익스트림
뒤에서 말하겠지만 'i7'프로세서는 인텔이 오랫동안 고수해왔던 FSB (Front Side Bus) 대신 QPI(QuickPath Interconnect)를 사용하고 있다. 또 3개의 DDR3 메모리 컨트롤러를 지원하는 등 지원 기능 부분에서 많은 개선이 이루어졌기 때문에 핀의 증가가 필요했던 것이다.
물론 유저들의 입장에서는 아쉬운 일이기는 하지만 성능 부분에서도 많은 부분 향상이 이루어졌다는 점을 감안한다면 굳이 단점으로 지적할만한 사항은 아닐 것으로 보인다.
![]()
X58 메인보드 CPU 소켓
프로세서의 사이즈가 대형화되다보니 발열의 면적도 커지게 된다. 때문에 인텔은 보다 효율적인 냉각을 위해 레퍼런스 쿨러의 사이즈를 키우고, 알루미늄 히트싱크만으로 제작됐던 기존 쿨러와는 달리 열전도율이 우수한 구리 재질의 히트싱크를 중간중간에 넣어 냉각 성능을 향상시키고자 했다.
참고로 '블룸필드' 다음으로 출시될 '린필드(Lynnfield)와 하벤데일(Havendale)은 1366 소켓 대신 1160 소켓으로 출시될 예정이지만 아직까지 확정된 사항은 아니다.
![]()
![]()
2) '틱-톡(Tick-Tock)' 모델에 따른 아키텍처 변경
인텔은 지난 2006년 코어마이크로 아키텍처의 발표와 더불어 '틱-톡(Tick-Tock)' 모델을 제시한 바 있다. 이는 한 해에는 제조 공정을 낮추고, 다음 해에는 아키텍처를 변화하고, 또 다음 해에는 공정을 낮추고 하는 식으로 공정과 아키텍처를 해마다 번갈아가면서 개선하는 개발 모델을 뜻한다.
인텔은 이 개발 맵에 따라 2006년 코어마이크로 아키텍처를 발표했고, 2007년에는 45nm 공정의 프로세서를 발표했다. 또 이번에 'i7'을 발표함으로써 이 '틱-톡' 전략을 충실히 따르고 있다.
때문에 'i7'프로세서는 기존의 울프데일 프로세서와 동일한 45nm 공정으로 제작됐다. 45nm 공정을 하이케이(Hi-K) 메탈 게이트 실리콘 기술을 기반으로 설계되며, 이로써 소비 전력과 발열을 획기적으로 낮췄다.
45nm 공정 프로세서에 대한 보다 자세한 정보는 '45nm가 무엇을 바꿀까? 인텔 코어 2 듀오 울프데일 E8500' 기사를 통해 확인할 수 있다.
3) FSB는 가라...QPI의 시대가 왔다
지난 인텔 프로세서의 역사를 대표하는 말 중에 하나가 바로 FSB(Front Side Bus)일 것이다. 하지만 코어 i7 프로세서의 출시로 FSB는 역사 속으로 자취를 감추게 될 것으로 보인다. 인텔이 보다 높은 대역폭을 확보하고 병목 현상을 줄이기 위해 FSB 대신 QPI(QuickPath Interconnect)를 도입했기 때문이다.
이는 i7 프로세서는 DDR3를 공식 지원하면서 충분한 대역폭을 필요로 하게 되는데, 기존의 FSB로는 무리가 따르게 된다. 때문에 이를 해결하기 위한 새로운 인터페이스인 QPI를 도입하게 됨으로써 높은 대역폭을 확보하고, 메모리 컨트롤러를 내장해 CPU와 칩셋, 메모리 간의 대역폭 부족 문제를 해결하고자 했다.
![]()
싱글 링크당 QPI의 데이터 전송률은 25.6GB/s로 FSB가 12.8GB/s를 갖는 것에 비해 2배 높다. QPI 전송 속도는 가장 고사양의 제품인 '965익스트림'이 6.4GT/s이며, 하위 제품인 '940'과 '920'이 4.8GT/s를 지원한다.
또한 노스브릿지인 MCH 대신 I/0 Hub(IOH)를 사용하게 된다. 이는 기존 메모리 컨트롤러가 CPU에 내장됨에 따라 이를 담당하던 MCH의 역할이 I/O와 PCI-Express 입출력을 담당만으로 줄어들게 됐으며, 이로써 사실상 MCH는 사라지고 IOH가 그 역할을 대신하게 되고 QPI는 CPU와 I/O Hub 간 20 Lane으로 연결된다.
4) CPU 안으로 들어간 메모리 컨트롤러
앞서 말했듯 i7은 DDR3 메모리를 지원하며, 3채널의 DDR3 메모리 컨트롤러가 CPU에 내장됐다. 이는 경쟁사인 AMD가 이미 전부터 채택해오던 방식이기도 한데, AMD가 두 개의 채널을 내장한 방식이었다면 인텔은 3채널의 메모리 컨트롤러를 내장했다.
기존 FSB를 사용하던 인텔 프로세서는 노스브릿지인 MCH에 메모리 컨트롤러를 내장하고, 이것이 CPU와 메모리의 다리 역할을 했다. 하지만 메모리 컨트롤러를 CPU에 내장함으로써 프로세서의 수에 따라 메모리의 최대 용량을 증가시킬 수 있게 됐으며, 데이터 지연 시간을 줄이고, 높은 대역폭을 확보할 수 있게 된 것이다.
![]()
또 메인보드에서 지원하는 3개의 DIMM 모듈과의 데이터 전송량을 높였고, 3채널 구성에서는 192bit(64bit x 3)를 지원해 2채널 128bit를 지원하는 AMD 프로세서에 비해 높은 대역폭을 제공할 수 있게 됐다.
참고로 DDR3-800MHz에서는 19.2GB/s를, 1066MHz에서는 25.5GB/s를, 1333MHz는 32GB/s, 1600MHz의 메모리에서는 38.4GB/s의 대역폭을 제공하게 된다. 하지만 DDR3-1600은 익스트림 제품군만 지원하는 것으로 알려졌다.
5) 다시 부활한 '하이퍼스레딩(Hyper Threading)'
하이퍼스레딩은 프로세서 코어의 갯수를 논리적으로 2배 증가시킴으로써 성능의 향상을 꾀하는 기술로 기존 펜티엄 4시절 노스우드 프로세서에서 사용하다 코어마이크로로 아키텍처를 전환하면서 슬며시 사라진 기술이다. 이 하이퍼스레딩 기술이 네할렘 아키텍처에서는 'Simultaneous Multi-Threading'라는 다소 생소한 이름으로 다시 부활했다.
우리가 흔히 말하는 싱글/듀얼/쿼드/옥타 코어라는 것은 물리적 코어, 즉 실제로 프로세서에 탑재돼 있는 코어의 갯수를 뜻하는 것이다. 때문에 코어2 프로세서에서의 듀얼 코어, 쿼드 코어 제품들은 실제로 코어가 2개, 4개씩 탑재돼 있었다.
하지만 이번에 출시된 'i7'프로세서는 물리적으로는 4개의 코어를 갖고 있지만 하이퍼스레딩 기술이 적용됨으로써 8개의 스레딩을 사용할 수 있게 됐고, 마치 8개의 코어를 사용하는 간접 효과를 누릴 수 있게 된 것이다.

물론 논리적으로 추가된 코어이기 때문에 실제 코어가 추가된 것 만큼의 효과를 100% 누리지는 못하지만(인텔에 따르면 약 30~40% 정도의 성능 향상이 있을 것으로 보인다) 멀티태스킹이 지원되는 프로그램에서라면 충분한 성능 향상을 기대할 수 있다.
또 이같은 하이퍼스레딩의 재등장으로 i7 프로세서는 물리적 코어를 늘릴 때보다 제조 단가를 낮추고, 전력 소모까지 줄일 수 있게 됐으니 두 마리의 토끼를 한꺼번에 잡을 수 있게 된 것이다.
6) L2를 넘어 L3로...L3 캐시의 등장
L3 캐시 메모리의 새로운 도입도 눈에 띄는 부분이다. 기존 코어2 프로세서들이 공유 방식의 L2 캐시를 사용했다면 i7 프로세서는 여기에 하나의 캐시를 더 추가해 L3 캐시를 공유하는 방식을 하고 있다. 또 가상의 메모리 어드레스를 물리적 메모리 어드레스로 변환해주는 TLB 역시 기존의 1차 레벨에서 추가돼 2차 레벨로 늘어났다.
코어마이크로 아키텍처는 L1 캐시를 각각의 코어들이 독립적으로 사용하고 L2 캐시를 공유하는 방식을 사용했다. 하지만 네할렘 아키텍처에서는 L1 캐시와 함께 L2 캐시도 각각 독립적으로 사용하고 L3 캐시는 공유하고 있다.
![]()
즉, 4개의 코어를 사용하기 때문에 4개의 L1/L2 캐시를 사용하고 1개의 L3 캐시를 사용하게 되는 것이다. 이로써 64KB 용량의 L1 캐시와 256KB의 L2 캐시를 사용하고, 8MB 용량의 L3 캐시는 공유하게 된다.
사실 이와 같은 L3 캐시 공유 방식은 네할렘이 최초라 말할 수는 없다. AMD 패넘 프로세서 역시 L3 캐시를 사용하고 있으며, 인텔 역시 기존 서버용 프로세서에서도 L3 캐시를 사용한 바 있다. 인텔은 이번 i7 프로세서에서 L3 캐시 공유 방식을 사용함으로써 기존 L2 캐시 방식에서의 지연 시간을 개선하고 성능 향상을 꾀하고 있는 것이다.
7) 터보 모드로 한층 개선된 전력 관리 기능
네할렘 아키텍처에서는 기존 모바일 플랫폼에서 사용되던 스마트 방식의 동적 소비전력 관리 기능인 터보 모드(Turbo Mode)를 한층 개선한 모습으로 사용하고 있다. 동적 소비전력 관리라는 것은 CPU 작동시 사용되지 않는 코어의 전력을 줄여주고, 이를 작동 중인 코어가 사용할 수 있게 만들어 성능까지 올려누는 것을 말한다.
코어2 프로세서와 같은 기존 멀티 코어 프로세서들은 프로그램의 싱글 스레드, 멀티 스레드에 상관없이 모든 코어가 동작하는 방식을 하고 있었다. 즉, 듀얼 코어 기반의 시스템에서 싱글 스레드 프로그램을 작동하더라도 CPU는 두 개의 코어를 모두 작동시켰고, 이로 인해 불필요하게 소비되는 전력량이 많을 수밖에 없었다.
하지만 터보 모드는 기존과는 다르게 사용하지 않는 코어는 대기 상태로 만들고, 전력 소모 크게 줄여 기존의 풀로드 방식의 전력 관리 기능을 보다 효율적으로 개선했다. 그리고 이렇게해서 줄어든 전력은 작동 중인 다른 코어로 전환해 보다 높은 성능을 이끌어내게 해준다.
![]()
![]()
여기에 추가로 '스마트'라는 표현을 붙인 것은 이 터보 모드는 사용자 임의로 활성/비활성화를 선택할 수 있으며, TDP와 클럭 설정이 가능해 사용자 중심의 전력 관리가 가능해졌기 때문이다.
특히, 터보 모드가 돋보이는 이유는 아직도 상당수의 프로그램들이 싱글 스레드를 기반으로 작동되고 있다는 점 때문이다. 최근 듀얼 코어의 급속한 보급으로 멀티 코어의 사용 비중이 높아지고 있다고는 하지만 여전히 많은 유저들이 싱글 스레드 기반의 프로그램을 원하고 있다. 그러므로 모든 코어를 풀 가동하는 기존 멀티 코어 방식은 사용자 입장에서는 무척 비효율적일 수밖에 없으며, 이것은 인텔이 추구하는 '그린 PC'와도 상반되는 것이라 할 수 있다.
8) SSE 4.2 명령어 추가
SSE의 명령어의 추가는 새로운 아키텍처 혹은 새로운 공정의 프로세서들이 추가될 때마다 항상 있어왔던 일이다. 이번 네할렘 프로세서도 전 세대인 45nm 울프데일 프로세서의 SSE 4.1에 이어 SSE 4.2 명령어를 사용하고 있다.
SSE 4.2 명령어는 STTNI와 ATA라는 두 가지 명령어 셋이 추가됐는데, STTNI는 XML 애플리케이션의 성능 향상을, ATA(Application Targeted Accelerator) 셋을 통해 텍스트 프로세싱 작업시 성능 향상을 꾀하고 있다.
3. 하이엔드 유저를 위한 최상의 선택 'i7'
'네할렘'은 출시되기 1년 전부터 수많은 소문들이 난무하면서 많은 유저들 사이에서는 큰 기대와 관심을 모았던 기대작이다. 특히 4개의 코어를 한 개의 다이에 집적한 인텔의 첫 네이티브 쿼드코어라는 점에서 인텔 프로세서 역사의 커다란 획을 긋는 기념비적인 제품이라 할 수 있을 것이다.
또 Hi-K 메탈을 기반으로 한 45nm 공정과 사용자의 소비 전력까지 고려한 터보 모드 기술은 최근 IT 업계에 불고 있는 '그린' 열풍을 충실히 따르고 있으며, 이에 앞으로 반도체 업체들이 가야할 방향을 제시해주고 있다.
![]()
기능면에서도 많은 개선이 있었다. 하이퍼스레딩과 L3 캐시의 등장으로 성능을 높였으며, SSE 명령어의 추가로 애플리케이션 구동 능력을 향상시켰다. 이와 같은 모든 점들을 종합해볼 때 네할렘 아키텍처가 적용된 'i7' 프로세서는 가히 현존하는 최강의 프로세서로 평가받을 수 있을 것이며, 프로세서 시장에서의 인텔의 우수성을 다시 한 번 입증한 제품이라 할 수 있다.
하지만 한 가지 안타까운 점이라면 '코어2 듀오' 때와는 다르게 하이엔드 제품인 '블룸필드'가 먼저 출시됐고, 메인스트림급 제품들은 내년 중반 이후에야 출시된다는 점이다. 서버 시장과 워크스테이션유저 등 하이엔드 시장을 공략한 제품이다보니 어쩔 수 없는 일이기는 하지만, 'i7' 프로세서를 접하고 싶은 유저들에게는 그림의 떡일 수밖에 없다.
게다가 환율의 급격한 상승으로 프로세서의 판매 가격이 당초 예상가보다 지나치게 높아졌다는 점도 인텔로써는 걸림돌일 수밖에 없다.

'i7 965 익스트림 에디션'의 공식 출시가는 미화 999달러인데, 국내에서는 167만원에 팔리고 있으며, 'i7 940'가 공식가인 562달러보다 높은 92만원에 팔리고 있다. 또 'i7 920' 역시 284달러의 출시 가격보다 한참 높은 43만원대에 팔리고 있어 안타까움을 자아내고 있다.
때문에 인텔 'i7' 프로세서도 여느 PC 부품과 마찬가지로 국내 시장에 몰아닥친 환율 폭풍을 어떻게 극복하느냐가 성패의 여부를 가늠하는 가장 큰 열쇠라 할 수 있겠다.
Posted by 좐군


