원문 : http://spectrum.ieee.org/computing/hardware/why-cpu-frequency-stalled#
BY Philip E. Ross // April 2008
얼마 전까지만 해도, PC 중앙 처리 장치 의 클럭스피트(cycle rate)를 경쟁적으로 자랑하며 말했다.
하지만 지금은 Overclocker 들만 클럭 스피드를 이야기하는 것으로 보인다.
오버클러커들은 CPU 의 클럭스피드 사양보다 더 높은 클럭 스피드로 CPU 를 사용하는 취미를 가진 사람들이다.
두 가지 이유가 있다.
하나는 CPU 클럭 레이트가 2년 전에 이미 Peak 에 도달했다.
또 하나는 클럭 레이트가 chip 성능에 아주 유용한 열쇠는 아니다.
클럭은 프로세서의 부품들이 조화롭게 동작하도록 유지한다. 마치 galley 선의 노잡이 처럼.
다른 것이 동일하다면, 클럭이 높을수록 더 많은 일을 할 것이다.
그런데, 왜 클럭을 더 빠르게 하지 않을까? 소비 전력과 방산되는 열 때문에 더 이상
비용대비 성능이 높지 않기 때문이다.
인텔은 멀티코어 프로세서의 기본 이론인 속도-파워간의 tradeoff 를 환기시킨다.
이런 이유 때문에 단일 칩에 두 개 이상의 처리 영역(코어)를 사용하는 것이다.
인텔에 따르면, 단일 코어의 클럭을 20%정도 낮추면 성능은 13% 밖에 떨어지지 않지만
전력의 50%를 줄일 수 있다고 한다.
두 코어를 80% 의 클럭으로 동작하도록 만들면, 동일한 전력으로 성능을 73% 까지 높을 수 있다는 뜻이다.
열은 한 곳이 아니라 두 곳에서 발산된다.
So even though the cutting-edge logic chip gulps ever more power [see graph, center], it isn't about to melt its way through the floor.
약 2년마다 주어진 실리콘 조각에 cram 하는 트랜지스터 수가 두 배씩 늘어난다는
무어의 법칙은 계속된다.
fundamental theorem 에 따라 우리는 상당히 오랫동안 트랜지스터를 완벽히 이용할 수 있다.
If once the whole choir of transistors had to sing to the beat of a single metronome, now it can split up into sections—and harmonize.
트랜지스터의 모든 박절기(metronome)의 비트에 따라 노래를 부를 수만 있다면,
여러 구역으로 나뉠 수 있고 조화를 이룰 수 있다.
CPU 의 소비 전력이 올라가면서 초당 cycle 에 촛점을 맞추는 맞추는 것이 덜 매력적이다.
any hint of stall 을 위배하지 않고도 더 좋은 성능의 측정치인 초당 처리 인스트럭션 수가 계속 올라갈 것이다.
이러한 이유 때문에 단일 프로세서에서 하던 일들이 여러 코어로 나누어지고 있다.
Intel Quad-core 칩에는 처리 코어가 네개가 있다.
BY Philip E. Ross // April 2008
얼마 전까지만 해도, PC 중앙 처리 장치 의 클럭스피트(cycle rate)를 경쟁적으로 자랑하며 말했다.
하지만 지금은 Overclocker 들만 클럭 스피드를 이야기하는 것으로 보인다.
오버클러커들은 CPU 의 클럭스피드 사양보다 더 높은 클럭 스피드로 CPU 를 사용하는 취미를 가진 사람들이다.
두 가지 이유가 있다.
하나는 CPU 클럭 레이트가 2년 전에 이미 Peak 에 도달했다.
또 하나는 클럭 레이트가 chip 성능에 아주 유용한 열쇠는 아니다.
클럭은 프로세서의 부품들이 조화롭게 동작하도록 유지한다. 마치 galley 선의 노잡이 처럼.
다른 것이 동일하다면, 클럭이 높을수록 더 많은 일을 할 것이다.
그런데, 왜 클럭을 더 빠르게 하지 않을까? 소비 전력과 방산되는 열 때문에 더 이상
비용대비 성능이 높지 않기 때문이다.
인텔은 멀티코어 프로세서의 기본 이론인 속도-파워간의 tradeoff 를 환기시킨다.
이런 이유 때문에 단일 칩에 두 개 이상의 처리 영역(코어)를 사용하는 것이다.
인텔에 따르면, 단일 코어의 클럭을 20%정도 낮추면 성능은 13% 밖에 떨어지지 않지만
전력의 50%를 줄일 수 있다고 한다.
두 코어를 80% 의 클럭으로 동작하도록 만들면, 동일한 전력으로 성능을 73% 까지 높을 수 있다는 뜻이다.
열은 한 곳이 아니라 두 곳에서 발산된다.
So even though the cutting-edge logic chip gulps ever more power [see graph, center], it isn't about to melt its way through the floor.
약 2년마다 주어진 실리콘 조각에 cram 하는 트랜지스터 수가 두 배씩 늘어난다는
무어의 법칙은 계속된다.
fundamental theorem 에 따라 우리는 상당히 오랫동안 트랜지스터를 완벽히 이용할 수 있다.
If once the whole choir of transistors had to sing to the beat of a single metronome, now it can split up into sections—and harmonize.
트랜지스터의 모든 박절기(metronome)의 비트에 따라 노래를 부를 수만 있다면,
여러 구역으로 나뉠 수 있고 조화를 이룰 수 있다.
CPU 의 소비 전력이 올라가면서 초당 cycle 에 촛점을 맞추는 맞추는 것이 덜 매력적이다.
any hint of stall 을 위배하지 않고도 더 좋은 성능의 측정치인 초당 처리 인스트럭션 수가 계속 올라갈 것이다.
이러한 이유 때문에 단일 프로세서에서 하던 일들이 여러 코어로 나누어지고 있다.
Intel Quad-core 칩에는 처리 코어가 네개가 있다.
태그 : multicore



덧글
예전에는 CPU 하나가 모든 것을 처리했지만, 컴퓨터의 처리능력을 여러군데로 분산하기 때문에 CPU만의 클럭이 더이상 높아질 이유가 없는 것도 이유겠죠.
충분해 보입니다. 하지만 저희 회사와 같이 대용량 데이타를 분석하는 입장에서 보면 클락스피드가 더 올라가면 좋겠거든요.
일반적인 Single-Thread 프로그램보다 멀티 쓰레드 프로그램이나 분산 프로그램을 개발,디버깅,유지, 관리하는데 비용이 훨씬
더 많이 들어가기 때문입니다. 하루 100GB 이상의 데이타를 분석하는 프로그램을 돌리는데, CPU 클락스피드가 더 올라간다면
single-thread 프로그램으로도 충분한데요. 클럭스피드가 더 이상 올라가지 않으니 multi-thread, 분산 프로그램으로 갈 수
밖에 없네요.