大数据与高性能计算
陈文光
Big Data and High Performance Computing
Wenguang Chen
表1
大数据与高性能计算的比较
大数据
高性能计算
研究范式
从数据中总结规律(第四范式)
数值模拟(第三范式)
主要应用领域
政府、商业、金融
科学与工程
主要硬件平台
廉价的商用服务器和普通以太网,网络延迟100 μs,带宽100 Mbit/s~1 Gbit/s
高性能服务器结点和高速专用网络,网络延迟1 μs,带宽40~56 Gbit/s
主要软件平台
着重容错与扩展性Hadoop、Spark等
着重执行效率MPI、OpenMP、Lustre等