LightDB的文本搜索特性的当前限制是:
每一个词位的长度必须小于 2K 字节
一个tsvector
(词位 + 位置)的长度必须小于 1 兆字节
词位的数量必须小于 264
tsvector
中的位置值必须大于 0 并且小于 16,383
<
(FOLLOWED BY)N
>tsquery
操作符中的匹配距离不能超过 16,384
每个词位不超过 256 个位置
一个tsquery
中结点(词位 + 操作符)的个数必须小于 32,768
为了对比,PG 8.1 的文档包含 10,441 个唯一词,总数 335,420 个词,并且最频繁的词“postgresql”在 655 个文档中被提到 6,127 次。
另一个例子 — PG的邮件列表归档在 461,020 条消息的 57,491,343 个词位中包含 910,989 个唯一词。