Skip to content
This repository has been archived by the owner on Oct 18, 2018. It is now read-only.

有做过性能测试么 #1

Open
hengfeiyang opened this issue Mar 24, 2016 · 4 comments
Open

有做过性能测试么 #1

hengfeiyang opened this issue Mar 24, 2016 · 4 comments

Comments

@hengfeiyang
Copy link

分词作为一个频繁调用的功能,一般都是本地的,这种远程api调用,数据量大了,性能怎么样,qps能支撑多少 1000qps 能达到么

@nyanshell
Copy link
Member

https://github.com/bosondata/elasticsearch-analysis-bosonnlp#注意 Seems its a limitation of Lucene.

@hzane
Copy link

hzane commented Mar 26, 2016

  • 每秒索引几十份文档,每个文档10个字段应该算不大的搜索引擎更新量
  • 这一秒钟几百请求就出去了
  • 生产环境要是每索引一份文档都要发出十几个http请求,我觉得谁也受不了
  • boson分词器要是本地化,基本我们就用了,要是封装个http-api就不好了

@keruimin
Copy link

@heartszhang 目前的Plugin受限于Lucene所提供的底层Analyzer实现框架,目前Beta版本作为较大规模生产环境的使用确还难以胜任。有几个改进:

  1. 只将有中文搜索需求的field定义为bosonnlp
  2. 我们在尝试改写Lucene本身的结构以达到批处理的效果
  3. 我们在讨论本地化的可行性

@noman798
Copy link

noman798 commented Apr 28, 2016

有什么进展吗?
我建议是不是可以先在本地写一个代理,把多次请求转换为单次请求?
@keruimin

Sign up for free to subscribe to this conversation on GitHub. Already have an account? Sign in.
Labels
None yet
Projects
None yet
Development

No branches or pull requests

5 participants