
P800 96ГБ PCIe
VRAM
96ГБ
ARCH
XPU‑P

Производитель
Baidu Kunlun — это линейка AI-ускорителей от китайской компании Baidu, предназначенная для облачных вычислений, edge-устройств и задач ИИ, включая обучение и инференс нейросетей. Разработки ведутся на собственной архитектуре XPU с акцентом на высокую производительность в задачах NLP, компьютерного зрения и мультимодальных моделей. Архитектура и спецификации Kunlun построен на 14-нм техпроцессе Samsung Foundry с 2.5D-упаковкой и HBM2-памятью (до 16 ГБ, пропускная способность 512 ГБ/с). Базовая модель K200 обеспечивает 256 TOPS в INT8, 64 TOPS в INT16/FP16 при TDP 150 Вт и интерфейсе PCIe 4.0 x8; она превосходит NVIDIA T4 в тестах вроде BERT и YOLOv3 на 2–3 раза по QPS. Архитектура включает XPU-SDNN для тензорных операций и XPU-кластеры с SIMD-ядрами для скалярных задач. Новые разработки В 2025 году Baidu анонсировала Kunlun M100 (для инференса MoE-моделей, запуск в начале 2026) и M300 (для обучения мультимодальных моделей, 2027). Поддерживаются фреймворки PaddlePaddle, TensorFlow, PyTorch через граф-компилятор и XPU C/C++. Суперноды Tianchi 256 обеспечивают связь до 256 чипов с пропускной способностью в 4 раза выше предыдущих версий. Применение и производительность Чипы Kunlun оптимизированы для Ernie Bot и реальных задач (NLP, vision, speech), с ПО, маскирующим различия с GPU NVIDIA. Они используются в облаке Baidu и демонстрируют эффективность в 3 раза выше FPGA/GPU в инференсе.
https://www.kunlunxin.com/→Продуктов
3