
네네네넨드넨드네네네넨드리스 [P4800X 750GB]

이전 리뷰의 업로드 날짜 자체는 8월이었습니다. 9월에는 리뷰는 물론이고 별다른 갱신도 없었네요. 변명 겸 기록을 위해 몇 마디를 해보자면, 바쁜 것도 있었지만 원인 불명의 시스템 부팅 실패로 한 달 동안 벤치마크가 중단되었습니다.
- 시스템이 켜지지 않음 + 파워도 팬이 돌아가지 않음
- 파워를 AS 보냈지만, 정상 판정을 받음
- 여전히 켜지지 않아 보드를 AS 보냄
- 불량 판정이 나와 제품 교환 후 수령함
- 재조립 후, 부팅을 시도해 보았지만, 켜지지 않음
- CPU 문제를 의심하고 다른 CPU를 대여해 장착함
- 켜지지 않음
이렇게까지 하니까 추석 연휴가 다가왔습니다. 완전히 끝장을 내자는 생각으로 시스템을 가지고 본가로 돌아가 고쳐보기로 했습니다.
그런데, 본가에 도착해서 전원을 켜보니 잘 작동했습니다.

그대로 복귀하여 전원을 켜보니 잘 동작합니다.

아무튼 작동하니 리뷰를 해야죠. Z-NAND처럼 관련 게시물을 작성하고 리뷰를 하려는 생각도 했었는데, 시간 문제로 이는 다음에 약간 더 깊게 다루어보도록 하겠습니다.
이 리뷰는 간단하게 성능 위주로 살펴보는 것이 목적입니다.
목차
Appearance
P4800X는 2.5" 15mm와 HHHL 폼팩터로 출시되었습니다. 제가 가진 P4800X는 전자에 해당하죠. 물리적으로는 2.5" 폼팩터에 해당하지만, U.2라고 부르는 SFF-8639 커넥터가 실장 되어 있는, 엄연한 NVMe SSD입니다. 이전, PM983 리뷰에서도 한 번 다룬 적이 있었죠.
이 친구는 이전에 제가 상당히 아껴왔는데, 지금은 딱히 그렇지 않습니다. 뚜껑을 따고 내부를 보여드리겠습니다.
사비로 진행하는 개인 리뷰 중에서 U.2인 P4800X의 내부를 직접 보여주는 사례는 두 손에 꼽지 않을까, 생각도 해봅니다. 사진의 기술도, 화질도, 기계도 아마 누구보다 뒤떨어질 테지만 말이죠.
어찌 되었든, 생각보다 별로 볼만한 것들이 없이 가볍게 구성된 모습이죠?
Internal Components
문외한의 입장에서 일부 IC만 찾아보았으며, 제조시기 등에 따라 변경될 가능성이 있습니다.
맞지 않을 확률이 상당히 높으니 재미로만 읽어주세요.


| Intel Optane SSD DC P4800X (750GB, U.2 15mm) | Launch Date: 2017 Q4 |
| Intel EAU10E23 SLL3D | Texas Instruments TMP102 |
| Intel 29P64B1ANDNF3 *(7+7) | Microchip PIC16F18346 |
| Richtek RT5062 | Texas Instruments OPA348 |
컨트롤러는 이전에 열어본 905P에서도 볼 수 있었던 Intel SLL3D를 사용합니다.
저장매체는 Intel 29P64B1ANDNF3 한 종류로 전면과 후면에 각 7개씩 사용되었습니다. NAND가 아닌 3D XPoint, 1세대의 128Gb Die를 사용했으며, QDP를 통해 칩당 64GB 용량을 구현합니다. 모두 합쳐 1024GB의 Raw Capacity가 구현됩니다.
905P의 OP비율은 17%였던 것을 생각해 볼 때, 37%에 달하는 OP비율은 어마무시합니다.
PMIC는 Richtek RT5062을 사용했습니다. 의외로 905P HHHL과 제조사부터 다른 소자가 채용되었는데, 폼팩터의 차이인지 라인업의 차이인지는 모르겠습니다.
Texas Instruments TMP102는 SMBus와 I2C 인터페이스를 가지고 있는 온도센서입니다.
Microchip PIC16F18346라는 MCU도 실장 되었는데, 905P의 PIC16F1829보다 상위 모델로 보입니다. 어떤 목적으로 실장이 된 것인지는 모르겠습니다.
Texas Instruments OPA348은 Single channel의 CMOS OP-AMP입니다.
Datasheet

Product Brief에서 이미지를 들고 왔습니다. 물론, 아래와 같이 Intel Ark를 참고할 수도 있죠.

905P와 비교하면, 성능은 약간 떨어지지만, 내구성이 3배 차이납니다. 905P의 10DWPD도 상당했는데 P4800X는 30DWPD에 달하니까 말이죠. 20%는 더 큰 OP 비율이 이 내구성에 한몫하는 것은 분명하겠죠.
Notable Points
재밌는 점이 많은 SSD 입니다. 다만, 905P 리뷰에서도 어느 정도 다루기도 하였기에, 3D XPoint 매체나 조심스러운 벤치마크 방법, Optane SSD의 다양한 SKU에 대해서는 시간이 될 때 각자의 글로 남기도록 하겠습니다.
SW Report

읽쓰기량이 좀 많죠? 대부분 제가 벤치마크를 테스트한다고 생긴 흔적입니다... 그렇지만 상태는 여전히 좋네요.
smartmontools와 NVMe-CLI의 id-ctrl 결과는 GitHub에 첨부하도록 하겠습니다.
DUT Summary
벤치마크를 진행할 SSD에 관한 요약입니다.
INTEL SSDPE21K750GA [P4800X 750GB] | |||
| Link | PCIe 3.0 x4 | NVMe Version | NVMe 1.1 |
| Firmware | E2010650 | LBA Size | 512/4096... |
| Controller | Intel SLL3D | Warning Temp | X °C |
| Storage Media | Intel 3DXP G1 | Critical Temp | X °C |
| Power State | Maximum Power | Entry Latency | Exit Latency |
| PS0 | 12.00 W | 0 μs | 0 μs |
평소와 다르게 직접 풀어쓰기 위해서LBA Size를 일부 생략했습니다. 표의 자리가 부족했거든요.
Data Size인 512B와 4096B에 따라 성능이 나뉩니다. Metadata Size 자체는 다양하게 있으나, 이것이 성능에 영향을 미치는 부분은 별로 없다고 명시되어 있습니다.
Data Size + Metadata Size로 산출되는 LBA Size는 512B, 520B, 528B, 4096B, 4104B, 4160B, 4224B입니다. 지금까지 제가 리뷰한 SSD 중 가장 종류가 많네요. 이번에는 일반적으로 사용되는 512B만을 대상으로 벤치마크를 진행했습니다.
Comparison Device
비교군은 아래와 같습니다.
| Name | Why? |
| 983 ZET 960GB [EEZ90R56] | 비슷한 시기의 Z-NAND를 활용한 SSD |
| 905P 960GB [E2010650] | 동일한 Optane SSD, 컨슈머 라인업 |
단, 보드가 교환되며 BIOS의 버전이 올라갔습니다. 이전엔 1067이었지만, 최신인 1087로 말이죠. Steady State의 성능에선 큰 차이가 없는 것을 확인했지만, Windows에서의 성능은 확인하지 못했습니다. 아쉬운 대로 벤치마크의 방법만 통일했습니다.
cSSD Benchmarking
벤치마크 방법에 대한 것은 이전 리뷰를 참고해 주시기 바랍니다.
CrystalDiskMark 9.0.1
FOB(Fresh Out of Box) 상태에서 NVMe 프로필로 진행합니다.

다른 항목은 비교적 평범하지만 RND4K Q1T1의 값이 Optane SSD라는 것을 보여주고 있습니다.

대체로 읽기 성능은 905P와 유사하지만, 쓰기 성능은 뒤처졌습니다.

4k QD1에서는 오차 이내의 값을 보여주었습니다. Z-NAND도 기존 NAND기반 SSD에 비해 월등히 우수한 4k QD1 읽기 성능이었지만, 3D XPoint 앞에선 자리를 내줍니다.
3DMark Storage Benchmark

CDM에서는 오차만큼의 차이를 보였던 4k QD1을 제외하고 전부 P4800X가 밀렸는데, 3DM에서는 혼자 5000점을 넘는 점수를 보여줍니다.
이해는 안 가지만, PM9E1이 5117점이었으니, 공개적으로 보여드린 점수 중에는 P4800X가 1위를 갱신해 버렸군요.
SPECworkstation 4.0

3DM과 같이 여기서도 가장 우수한 점수를 냈습니다. 다만, 신기록의 갱신은 아니었습니다.

자세한 지표를 둘러보면 7zip이나 ccx, cfd와 같은 일부 워크로드에선 983 ZET가 가장 우수했습니다. 특히, 이 친구들이 1.0을 달성하지 못한 7zip 워크로드가 눈에 띄는데, 당연히 순차 집약적인 작업으로 생각이 되죠?
Fill Drive
나래온 더티테스트와 비슷한 벤치마크입니다. FOB상태로 시작하여, SEQ 128k QD256으로 드라이브 전체를 2회 채우며, 0.1s 단위로 값을 측정합니다. 휴식은 충분히 부여됩니다.

P4800X의 그래프가 좀 이상합니다.

두 번째도 값의 편차가 꽤 심한 것은 매한가지입니다.

전체에 대한 평균값은 P4800X가 가장 뒤처졌습니다.
Sync Performance
순차와 랜덤 성능은 자체 Pre-Conditioning 이후에 해당 영역에 한하여 측정됩니다.


HW PLP를 위해 커패시터가 구현된 983 ZET나 애초에 별도의 PLP용 커패시터가 필요하지 않은 Optane SSD나 Sync Performance를 측정하는 의미는 없습니다.
단, 아래의 랜덤 쓰기 성능이 약간 이상합니다. 905P를 잠깐 리뷰할 땐 눈치채지 못했는데, Optane SSD들의 지연시간이 기댓값인 10µs의 2배에 달하고 있습니다.
Low QD Performance by RW Ratio
Performance versus QD
이전과 마찬가지로 Pre-Conditioning 이후에 측정하며, 데이터의 양은 올바른 Burst 성능을 측정하기 위해서 GB단위가 되지 않습니다.

여기서도 마찬가지로 쓰기 성능이 이상합니다. QD4는 정상적인 것 같다는 느낌이 들긴하는데 말이죠...
Weighted Graph
QD1 70%, QD2 20%, QD4 10%로 가중치를 부여해 보기 쉽게 나타냅니다.

가중치 그래프에선 NAND기반의 SSD와 다른 개형을 보여줍니다.

평균값을 낸 결과, P4800X와 905P간에는 거의 동일한 결과였지만, 983 ZET와도 드라마틱한 차이를 벌리진 못했습니다. QD1, QD2 쓰기 성능의 문제를 해결하게 된다면 차이를 벌릴 수 있을 것이라 기대되는데 말이죠.
eSSD Benchmarking
일부 워크로드에 대한 Steady State를 측정해 봅시다. 벤치마크 방법에 대한 것은 마찬가지로 이전 리뷰를 참고해 주시기 바랍니다.
SEQ Pre-Conditioning
Sequential Pre-Conditioning은 cSSD 벤치마크의 Fill Drive에서 보았던 것처럼 편차가 큰 그래프를 보여줍니다. QD256이라는 환경이라 발생한 문제일까요? 아래에서 다시 얘기해 봅시다.
SEQ Performance

순차 읽기입니다. QD=4까지는 Optane SSD들이 앞서있었으나, QD=8부터는 Z-SSD가 우수합니다. P4800X가 905P보다 약간 느린 모습도 확인할 수 있었습니다.
스펙 성능인 2500MB/s는 초과하는 모습이며, Consistency는 아래와 같습니다.
| IOPS Consistency | P4800X | 983 ZET |
| QD1 | 99.5% | . |
| QD2 | 99.7% | . |
| QD256 | 94.0% | 97.8% |

순차 쓰기입니다. 모든 조건에서 Z-SSD가 더 우수한 것을 확인할 수 있었습니다. 모두 다 QD=2에서 포화된 상태인데, P4800X가 가장 뒤떨어지는 모습입니다.
스펙 성능인 2200MB/s를 달성하지 못하고 2100MB/s 부근에서 맴돌았습니다.
| IOPS Consistency | P4800X | 983 ZET |
| QD1 | 96.5% | . |
| QD2 | 82.2% | . |
| QD256 | 84.1% | 95.5% |
IOPS Consistency를 보면 Pre-Conditioning을 할 때 확인할 수 있었던 것처럼, QD256에서 굉장히 떨어지는 것을 확인할 수 있는데, QD1에서는 우수한 모습입니다.
대역폭이 포화되는 것과 관련 있는 현상이 아닌가 싶기도 합니다.
RND Pre-Conditioning
Random Pre-Conditioning도 편차가 심한 것은 매한가지입니다. 하지만 3D XPoint를 저장매체로 하는 만큼, 별도의 Transition 영역이 관찰되지 않습니다.

지연시간에선 NAND기반 저장장치 때문에 구별이 되질 않아 항목을 제한하여 제시합니다.
RND Performance

983 ZET 리뷰에서도 Z-NAND가 일반적인 NAND기반 저장장치보다 훨씬 우수한 그래프를 그리는 것을 확인했었는데, Optane은 더 우수한 모습입니다. 물론 최대로 제공할 수 있는 IOPS는 983 ZET 쪽이 높았지만요.
스펙시트의 550k IOPS는 만족하고도 남는 성능을 보였습니다.

바닥 부분을 자세히 관찰하기 위해 Y축을 100µs로 제한해 보았습니다.
IOPS Consistency는 아래와 같습니다.
| IOPS Consistency | P4800X | 983 ZET |
| QD2 | 98.5% | . |
| QD4 | 97.6% | . |
| QD8 | 98.4% | . |
| QD256 | 99.6% | 99.0% |

이번엔 랜덤 쓰기 성능입니다. 읽기에선 P4800X가 905P에 약간 밀리는 모습이었는데, 여기선 꽤 차이가 납니다. 거기에 더해, 스펙의 550k IOPS에 못 미치는 것이 확인되었습니다.

여기서도 읽기와 마찬가지로 100µs로 지연시간을 제한한 그래프입니다. 눈썰미가 좋으신 분들은 이 그래프를 보기 전에 예상하셨을 것으로 생각합니다.
P4800X를 포함한 Optane SSD들의 Low QD 랜덤 쓰기 성능이 이상합니다. Z-NAND보다 뒤처지는것은 물론이고, QD=1과 QD=2에서의 지연시간이 20µs를 초과합니다.
IOPS Consistency는 아래와 같습니다.
| IOPS Consistency | P4800X | 983 ZET |
| QD2 | 99.5% | . |
| QD4 | 98.1% | . |
| QD8 | 85.2% | . |
| QD256 | 84.5% | 89.9% |

혼합 성능입니다. 쓰기 비율이 30%라서 그런 것일까요? 비교적 정상처럼 보입니다...

사실, 랜덤 읽기 그래프도 자세히 보면 QD=1과 QD=2 상황에서 지연시간이 늘어졌습니다. 한데, 혼합 성능에선 QD=1 성능이 비교적 정상적으로 보입니다.

뜌땨이가 된 기분입니다...
Quality of Service
QD1에서의 지연시간을 IO단위로 모두 분석해서 때려 박았습니다.



앞서 말한 대로, QD=4 환경에서 가장 우수한 지연시간을 보였습니다. 어느 정도냐 하면, 아래 표에서 Typical Value의 RND Read-Write 값이 각각 8.384µs와 10.786µs였습니다.
처음엔 다른 것을 확인하지 않고 QD=1 랜덤 읽기 성능만 확인하며 지연시간이 이렇게 늘어지는 것이 AMD 플랫폼이라 그런가 했지만, QD=1 랜덤 쓰기 성능의 뒤처짐, QD=4 지연시간에서 sub 10µs의 달성을 보고 그런 생각은 집어치웠습니다.
| RND Read | Datasheet | Benchmark Result |
| Typical Value | < 10 µs | 10.944 µs |
| QoS (99.999%) | 60 µs | 77.36 µs |
| RND Write | Datasheet | Benchmark Result |
| Typical Value | < 10 µs | 22.656 µs |
| QoS (99.999%) | 100 µs | 77.66 µs |
원래 예정대로 벤치마크가 성공적으로 종료되었다면, 이쯤에선 Optane의 QoS 관리 능력에 대해 장황한 칭찬을 늘어놓고 있었을 텐데, 이상하게 되어버렸네요.
Closing
어정쩡하게 끝난 리뷰가 되었습니다. 찝찝함만 남았어요.
안 올리고 미루면 시험공부도 집중이 안 될 것 같아서, 일단 마무리하고 올리게 되었는데 약간 의미가 없는 리뷰가 되어버린 것 같아서 더욱 찝찝합니다. 예상가는 점이 몇 군데 있어, 벤치마크를 조금 개선하기도 했습니다. 아래 그래프를 참고해주세요.


정상으로 돌아온 Low QD 쓰기 성능이지만, 이번엔 읽기 성능이 나빠졌습니다. 그래도 허용값 이내라고 봐야할까요?
QoS 그래프도 다시 그려보았습니다. 혼합 워크로드에선 10µs 이하의 지연시간도 관측되었네요.
이 개선에 관한 내용은 P5800X 리뷰를 할 때 다시 언급을 하도록 하겠습니다.
아무튼, 환절기입니다. 읽어주시는 모든 분께 호흡기 질환 조심하길 바라며 글 마칩니다. 저도 목이 아프네요.
그럼 이제 중간고사 공부를 해봅시다.













Comments