MemryX MX3 Chip
【硬體性能指標】
- 卓越算力: 單顆晶片在 1GHz 頻率下可提供高達 6 TFLOPs 的運算效能,且具備極高的硬體利用率。
- 強大的擴充性: 支援多達 16 顆晶片互連,系統總算力可彈性擴展至 96 TOPS/TFLOPs。
- 高精度運算: 採用 bfloat16 激活函數,確保在提升速度的同時維持高精度的推論結果。
- 靈活的模型權重: 支援 4 / 8 / 16 bit 權重配置,平衡效能與精準度需求。
【系統整合優勢】
- 即時處理(Batch = 1): 專為低延遲應用設計,在 Batch Size 為 1 的情況下仍能保持高效能,適合即時影像分析。
- 存儲容量: 單晶片可承載 10.5M 個 8-bit 權重參數。
- 標準化介面: 提供 PCIe Gen 3 或 USB 3 介面,可與大多數主機系統無縫連接。
極致能耗比: 平均功耗僅 0.6W 至 2W(視 AI 模型與系統配置而定),大幅降低散熱設計負擔。
下載產品簡介...


MemryX M.2 Module
【模組技術規格】
- 多核心運算架構: 單一模組內連 4 顆 MX3 晶片,提供更強大的並行處理能力。
- 卓越運算效能: 在 1GHz 運作頻率下,提供高達 24 TFLOPS 的總運算算力。
- 標準化外型設計: 採用標準 2280 M-Key (22 x 80mm) 規格,相容於絕大多數工業電腦與伺服器插槽。
- 大規模模型支援: 具備承載 4,200 萬個 (42M) 8-bit 權重參數 的能力,支援更複雜的 AI 模型運算。
- 高效能傳輸介面: 支援 x2 或 x4 PCIe Gen 3 介面,確保主機與加速器之間的高速數據交換。
- 嚴苛環境適用性: 具備 -40ºC 至 85ºC 的工業級寬溫 支援,確保在極端環境下仍能穩定運行。
下載產品簡介...
MemryX 軟體生態系
【軟體核心亮點】
- 一小時內快速上手: 優化的安裝流程,讓用戶在不到一小時內即可完成環境建置並開始編譯模型。
- 智慧編譯器 (Smart Compiler): 自動化且優化的 AI 模型映射技術,能將模型精準配置於 MemryX 硬體架構,極大化運算效率。
- 強大的 API 支援: 提供 Python 與 C/C++ 介面,涵蓋底層到中層的 API 呼叫,滿足不同深度的 AI 整合需求。
- 多系統運行環境 (Runtime): 完整的驅動程式與韌體支援,完美相容 Windows 與多種 Linux 發行版。
- 位元精確模擬器 (Bit Accurate Simulator): 即使在尚未取得硬體的情況下,也能透過模擬器精確測試模型表現,確保模擬與實際運算結果高度一致。
前往開發者專區...


