GeomTuple build&publish
High-performance serialization for multi-dimension arrays 针对大量数据网络传输设计的序列化方案,用于储存多维数组 通过直接内存操作实现高于 JSON 多个数量级的性能和更小的传输体积
High-performance serialization for multi-dimension arrays
针对大量数据网络传输设计的序列化方案,用于储存多维数组
通过直接内存操作实现高于 JSON 多个数量级的性能和更小的传输体积
《序列化方案选型建议》
see ./csharp
npm install --save dimbin
import DIMBIN from 'dimbin' // v3 // import DIMBIN from 'dimbin/v2' // old version
const data = [ [0, 1, 2, 3], // 普通数值数组 ✅ new Int16Array([1, 2, 3, 4]), // TypedArray ✅ [ // 更高维度数组 ✅ [0, 1, 2], [0, 1, 2, 3, 4], ], DIMBIN.stringsSerialize(['a', 'bc', '😊']), // Array<string> DIMBIN.booleansSerialize([true, false, true, true]), // Array<boolean> ] // 序列化为ArrayBuffer const bin = DIMBIN.serialize(data) // 反序列化为 Array<TypedArray> const dim = DIMBIN.parse(bin) dim[3] = DIMBIN.stringsParse(dim[3]) dim[4] = DIMBIN.booleansParse(dim[4]) /* [ Float32Array{0, 1, 2, 3}, Int16Array{1, 2, 3, 4}, [ Float32Array{0, 1, 2}, Float32Array{0, 1, 2, 3, 4}, ], ['a', 'bc', '😊'], [true, false, true, true] ] */
DIMBIN 为多维数组而设计, 因此传入的数据结构必须为多维数组, 数组维数没有上限, 每一维度数组的元素个数上线为 2^32 . 维度和数组元素个数受运行环境和设备限制.
// 粒子 🌰 // 正确的格式 const input = [ // Array [1, 2, 3], // TypedArray new Float32Array(1000), // higher dimensions [ // [4, 5, 6], new Float64Array(2000), ], ] const wrong1 = [ // 必须为多维数组 1, 2, 3, ] const wrong2 = [ // - 数组元素必须 *全部为数组* 或者 *全部为数值* [1, 2, 3, [4], [5]], ] const wrong3 = [ // 非数值数据需要先转换为数值数据 ['123', 'hello'], ]
数组的元素支持以下数据类型
默认情况下, 所有的数据将使用 Float32 格式进行保存. 如果需要指定数据格式, 请先转换成 TypedArray. 如需要处理字符串和布尔值, 请使用对应的接口预先转换成 TypedArray.
serialize
序列化为二进制数据
{Array<TypedArray|Array<number|TypedArray|Array>>} data
{float} magicNumber
{ArrayBuffer}
parse
反序列化回多维数组
{ArrayBuffer|Buffer|DataView} buffer
{Array<TypedArray|Array<TypedArray|Array>>}
getMeta
读取二进制数据的元数据
{Meta}
interface Meta { version: number magic_num: number seg_meta_bytes: number seg_meta_start: number len: number big_endian: boolean }
stringsSerialize
将 Array 序列化成 TypedArray
{string[]} strs
{UInt8Array}
stringsParse
将 stringsSerialize 生成的二进制数据解析回 Array
{string[]}
booleansSerialize
{boolean[]} strs
booleansParse
将 booleansSerialize 生成的二进制数据解析回 Array
{boolean[]}
JS 环境下:当使用纯数值数据时
在 JS 环境中, 性能高于 flatbuffers 30%~100%, 远高于 protocolbuffers.
详细 benchmark 以及与 JSON / ProtocolBuffers / FlatBuffer 的对比与选型建议 >>>
序列化方案选型对比
npm install
npm start
open http://localhost:3112/html/api in your browser.
http://localhost:3112/html/api
npm test
npm run dist
specifications/v3.md
版权所有:中国计算机学会技术支持:开源发展技术委员会 京ICP备13000930号-9 京公网安备 11010802032778号
DIMBIN
《序列化方案选型建议》
Useage
C
see ./csharp
javascript
npm install --save dimbin数据结构
DIMBIN 为多维数组而设计, 因此传入的数据结构必须为多维数组, 数组维数没有上限, 每一维度数组的元素个数上线为 2^32 . 维度和数组元素个数受运行环境和设备限制.
数组的元素支持以下数据类型
默认情况下, 所有的数据将使用 Float32 格式进行保存. 如果需要指定数据格式, 请先转换成 TypedArray. 如需要处理字符串和布尔值, 请使用对应的接口预先转换成 TypedArray.
API
C
see ./csharp
javascript
serialize序列化为二进制数据
{Array<TypedArray|Array<number|TypedArray|Array>>} data多维数组{float} magicNumber用户控制的标识位{ArrayBuffer}parse反序列化回多维数组
{ArrayBuffer|Buffer|DataView} buffer序列化后的二进制数据{Array<TypedArray|Array<TypedArray|Array>>}getMeta读取二进制数据的元数据
{ArrayBuffer|Buffer|DataView} buffer序列化后的二进制数据{Meta}stringsSerialize将 Array 序列化成 TypedArray
{string[]} strs元素为字符串的数组{UInt8Array}序列化后的二进制数据stringsParse将 stringsSerialize 生成的二进制数据解析回 Array
{UInt8Array}序列化后的二进制数据{string[]}元素为字符串的数组booleansSerialize将 Array 序列化成 TypedArray
{boolean[]} strs元素为布尔值的数组{UInt8Array}序列化后的二进制数据booleansParse将 booleansSerialize 生成的二进制数据解析回 Array
{UInt8Array}序列化后的二进制数据{boolean[]}元素为布尔值的数组Performance
JS 环境下:当使用纯数值数据时
在 JS 环境中, 性能高于 flatbuffers 30%~100%, 远高于 protocolbuffers.
详细 benchmark 以及与 JSON / ProtocolBuffers / FlatBuffer 的对比与选型建议 >>>
序列化方案选型对比
Development
npm installnpm startopen
http://localhost:3112/html/apiin your browser.npm testnpm run distSpecifications
specifications/v3.md