컴퓨터 구조 & 운영체제/컴퓨터 구조

[컴퓨터 구조] 빠른 CPU를 위한 설계 기법

ReBugs 2023. 4. 10.

이 글은 혼자 공부하는 컴퓨터 구조 + 운영체제 (저자 : 강민철)의 책과 유튜브 영상을 참고하여 개인적으로 정리하는 글임을 알립니다.


CPU의 성능을 높이기 위해서 아래 3개의 방법을 생각해 볼 수 있다.

  • 클럭 신호를 빠르게 하는 방법
  • 코어 수를 늘리는 방법
  • 스레드의 수를 늘리는 방법

 


클럭

  • 컴퓨터 부품들은 클럭 신호에 맞춰 움직인다.
  • CPU는 명령어 사이클에 따라 명령어들을 실행한다.

클럭 신호가 빠르게 반복되면 CPU를 비롯한 컴퓨터 부품들은 그만큼 빠른 박자에 맞춰 움직이게 된다.

실제로 클럭 속도가 높은 CPU는 일반적으로 성능이 좋다.

CPU는 매번 일정한 클럭 속도가 아니라 고성능을 요구하는 순간에는 빠르고, 그렇지 않을 때는 느리게 작동한다.
최대 클럭 속도를 강제로 더 끌어올릴 수 있는데, 이런 기법을 오버클럭킹이라고 한다.

 

하지만 클럭 속도를 끝도 없이 늘린다고해서 무조건 CPU의 성능이 좋아지는 것은 아니다.

그렇게 하면 CPU의 발열 문제가 심각해지기 때문이다.

 

코어와 멀티코어

CPU는 명령어를 실행하는 부품이다.

많은 전공 서적들의 전통적인 관점에서 명령어를 실행하는 부품은 원칙적으로 하나만 존재했다. 하지만 현대에는 CPU 내부에 명령어를 실행하는 부품을 얼마든지 만들 수 있게 되었다. 

CPU의 정의로 알고 있던 "명령어를 실행하는 부품"은 오늘날 코어라는 용어로 사용된다.

현대의 CPU는 명령어를 실행하는 부품을 여러개 포함하는 부품으로 명칭의 범위가 확장되었다.

https://velog.io/@mrcocoball

코어를 여러 개 포함하고 있는 CPU를 멀티코어CPU 또는 멀티코어 프로레서라고 부른다.

당연히 처리 속도는 단일 코어보다 멀티코어가 더 빠르다.

하지만 코어의 수를 n개 늘린다고 해서 CPU의 연산속도가 n배 늘어나지 않는다.

이는 4인분의 요리를 100명의 요리사가 만든다고 생각하면 편하다.

중요한 것은 코어마다 처리할 명령어들을 얼마나 적절하게 분배하느냐 이다.

 

스레드와 멀티 스레드

스레드의 사전적 의미는 실행 흐름의 단위이다.

스레드는 하드웨어적 스레드와, 소프트웨어적 스레드로 나뉜다.

  • 하드웨어적 스레드 : 하나의 코어가 동시에 처리하는 명령어 단위
  • 소프트웨어적 스레드 : 하나의 프로그램에서 독립적으로 실행되는 단위

 

하드웨어적 스레드

스레드를 하드웨어적으로 정의하면 "하나의 코어가 동시에 처리하는 명령어 단위"를 의미한다.

CPU에서 사용하는 스레드라는 용어는 보통 하드웨어적 스레드를 의미한다.

1코어 1스레드는 명령어를 실행하는 부품이 하나있고, 한 번에 하나씩 명령어를 실행하는 CPU를 의미한다.

2코어 4스레드는 명령어를 실행하는 부품이 두 개있고, 한 번에 네 개의 명령어를 실행하는 CPU를 의미한다.

한 코어로 여러 명령어를 실행하는 CPU를 멀티 프로세서 또는 멀티스레드 CPU라고 한다.

 

소프트웨어적 스레드

스레드를 소프트웨어적으로 정의하면 "하나의 프로그램에서 독립적으로 실행되는 단위"를 의미한다. 

프로그래밍 언어나 운영체제를 공부할 때 접하는 스레드는 보통 소프트웨어적으로 정의된 스레드를 의미한다.

하나의 프로그램은 실행되는 과정에서 한 부분만 실행될 수도 있지만, 프로그램의 여러 부분이 동시에 실행될 수도 있다.

메모리에서의 싱글 스레드와 멀티 스레드를 도식화하면 아래와 같다.

https://velog.io/@mrcocoball

 

한 번에 하나의 명령어를 처리하는 1코어 1스레드 CPU도 소프트웨어적 스레드를 수십개 실행할 수 있다.

이는 하드웨어적 관점의 스레드 하나가 소프트웨어적 스레드 여러개를 엄청나게 빠른속도로 번갈아가면서 하기때문이다.

이러한 엄청난 속도로 번갈아가면서 작업을 하면 일반적인 사람은 동시에 작업을 처리한다고 느끼게된다.

 

멀티스레드 프로세서

용어의 혼동을 방지하기 위해 이제부터 소프트웨어적으로 정의된 스레드는 "스레드", CPU에서 사용되는 스레드는 '하드웨어 스레드'라고 하겠다.

멀티스레드 프로세서는 하나의 코어로 여러 명령어를 동시에 처리하는 CPU이다.

이 프로세서의 핵심은 레지스터이다.

하나의 프로세서로 여러 명령어를 동시에 처리하도록 만들려면 프로그램 카운터, 스택 포인터, 데이터 버퍼 레지스터 등 하나의 명령어를 처리하기 위해 꼭 필요한 레지스터들을 여러개 가지고 있으면 된다.

하나의 명령어를 실행하기 위해 꼭 필요한 레지스터들을 편의상 레지스터 세트라고 한다면, 레지스터 세트가 한 개인 CPU는 한 개의 명령어를 처리하기 위한 정보들을 기억할 뿐이지만, 레지스터 세트가 두 개인 CPU는 두 개의 명령어를 처리하기 위한 정보들을 기억할 수 있다.

따라서 ALU와 제어장치가 두 개의 레지스터 세트에 저장된 명령어를 해석하고 실행하면 하나의 코어에서 두 개의 명령어가 동시에 실행된다

 

하드웨어 스레드를 이용해 하나의 코어로도 여러 명령어를 동시에 처리할 수 있다고 했는데, 메모리 속 프로그램 입장에서 봤을 때 하드웨어 스레드는 마치 한 번에 하나의 명령어를 처리하는 CPU나 다름이 없다. (여러개의 스레드를 번갈아가면서 하는 것이기 때문)

2코어 4스레드 CPU는 한 번에 4개의 명령어를 처리할 수 있는데, 프로그램 입장에서는 하나의 명령어를 처리하는 CPU가 4개 있는 것처럼 보인다.(한 개의 하드웨어 스레드가 2개의 스레드를 처리할 수 있기 때문(2 X 2 = 4))

따라서 하드웨어 스레드를 논리 프로세서라고 부른다.

댓글