大数据与高性能计算
陈文光

Big Data and High Performance Computing
Wenguang Chen
表1 大数据与高性能计算的比较
大数据 高性能计算
研究范式 从数据中总结规律(第四范式) 数值模拟(第三范式)
主要应用领域 政府、商业、金融 科学与工程
主要硬件平台 廉价的商用服务器和普通以太网,网络延迟100 μs,带宽100 Mbit/s~1 Gbit/s 高性能服务器结点和高速专用网络,网络延迟1 μs,带宽40~56 Gbit/s
主要软件平台 着重容错与扩展性Hadoop、Spark等 着重执行效率MPI、OpenMP、Lustre等