}
«网站首页

eaglet

关注此人
把eaglet加为好友
附言:



最新动态
  • @yuejianjun
    你可以用 lucene 的 3.0 版本试试,据说对这块做了较大优化,我还没做这方面的对比测试,打算最近做。lucene.net 目前也有一个 3.0 的开发版本,我测试过,好像还有一些bug,不太稳定,所有我和 lucene.net 的测试都是基于lucene.net 2.9.4 的。
  • @ramic
    hubbledotnet 是全文搜索组件,你可能之前没接触过。
  • @itmuse
    只对 tokenized 和 untokenized 字段建索引,数据会写入数据源,如果不想安装数据库,可以用 sqlite 做数据源。我后面会做个hubble自己的数据源,这样就和lucene 的方式一样了,全部在 hubble 内部管理了。
  • @itmuse
    可以的,用主动模式索引就可以。主动模式下,直接调用 HubbleCommand 那个类执行 insert 语句就可以实现类似 lucene.net 效果。如果是批量插入,多个insert 语句间用封号隔断。
  • @itmuse
    理论上是可以的,可能要对一些路径做个修改,我后面打算做这个事情。
  • 属性要参与查询还是只是显示?
  • eaglet 回复小组话题:HubbleDotNet支持MongoDB吗? 2012-05-10 13:06
    已经支持了,关注我的最新博客
  • HubbleDotNet 从 1.2.3 版本以后开始在官方代码中支持和 Mongodb 对接,Mongodb 是10gen 公司开发的 no-sql 数据库,其读写性能比传统关系数据库要快很多,而...
  • eaglet 评论博客:算法系列-计数排序 2012-05-05 19:03
    @东火
    输入数据不需要是连续的,C的数字大小取决于A的最大值,就是那个k。
  • @viky88
    @viky88
    like '%xx%' 目前版本是直接到数据库去 like ,效率很低,最好不要这么用。
  • 回收是因为你的应用程序池回收了,可以设置IIS 把回收时间加长。序列化问题可能是你的某个文件用了较老版本的 lucene.net 生成,然后反序列化时又用了新版本的 lucene.net ,由于 bi...
  • @viky88
    我发邮件到你QQ邮箱了。
    第二个问题,可以用镜像表,这样就可以脱离sql 数据库了。
    另外如果你只是做全文查询,并且返回的字段都是 untokenized 的类型,查询时也可以脱离数据库。
  • @viky88
    总数的问题,是因为或的时候为了减少合并次数,做了优化,只以最小的一个结果集的总数显示。我会考虑在新版本中对较少数量的结果集做合并以显示正确的总数。
    多列放一个字段后搜索出错的问题,能否具体一点,sql 语句是什么样子的,出错信息是什么,堆栈是什么。
  • eaglet 评论博客:C# 重启计算机的问题 2012-04-14 17:06
    @wolfram
    恩,从一个国外的代码中拿过来改的。
  • @viky88
    页数增多是因为老版本对 match 做过优化,1.2 版本取消了这个优化,你试试1.2 版本。
  • eaglet 评论博客:C# 重启计算机的问题 2012-04-13 14:18
    @Cocoo
    你说的 shutdown 的方法,我的文章一开始已经提到了,这个方法同样需要赋予足够的权限才可以运行。如果要用 shutdown,需要先给当前进程赋予关闭计算机的权限,然后在调用 shutdown.exe 时将当前权限继承给子进程。
  • eaglet 评论博客:C# 重启计算机的问题 2012-04-13 14:15
    @秋色
    怎么是个安装程序?有代码吗?或者可以说一下原理吗?怎么能做到1秒以内关机或重启?我看一些控制软件确实可以做到跳过 windows log off 重启,但不知道是怎么做到的,感觉好像是要向操作系统直接输出一个中断。
  • eaglet 发表博客:C# 重启计算机的问题 2012-04-13 13:57
    C# 程序重启计算机的方法很多,网上也有不少这方面的文章,不过很多网上提供的方法在某些情况下无法获取重启计算机的权限导致重启失败。本文对这些方法做一些简单的讨论。
  • @viky88
    请参考下面文章
    http://www.cnblogs.com/eaglet/archive/2012/02/15/2352094.html
  • @viky88
    能把联系方式发站内短信给我吗?我需要你的数据测试一下,看看是不是bug。
  • @viky88
    /PAE 是没有用的,那个是打开 AWE 方式,这个 hubble 不支持。AWE 最大 map 的地址也只有2GB,要支持更多,要把之前map的unmap掉。
    你可以尝试打开 /3GB 开关。 你的服务器内存这么大,却使用32位操作系统,导致单个进程最大只能申请2GB内存,感觉有点浪费了,如果可能,还是建议用64位操作系统。
    Query Cache 不是内存索引,是查询缓存,在 tableinfo 中是另外一个选项。
    另外请把查询语句和相关字段的索引情况以及查出来的结果给我看看。
  • @viky88
    OutOfMemeory 错误可能是因为你使用的是32 bit的操作系统,而你的数据量又比较大。我一般推荐数据量比较大时用64bit操作系统,这样就不会出现这个问题。如果暂时不能升级为64bit操作系统,请试试看打开 3GB 开关。
    结果少的问题,有两种可能
    1. 你的版本比较低,在某些较低版本中存在这方面bug
    2. 你在table info 中关掉 query cache 试试,有时候这个问题是缓存问题,但新版本已经改正了。
    3. 你的数据没有同步,索引和数据源对不上。
  • eaglet 回复小组话题:HubbleDotNet支持MongoDB吗? 2012-03-29 10:41
    正在开发,应该很快就可以支持了。
  • eaglet 评论博客:不重复随机数列生成算法 2012-03-27 12:58
    @dshawshank
    Random.Next 的第二个参数必须要大于0,因为是半开半闭区间,所以这里使用的是 end + 1,因为 end 是0起始的。
    我举个例子,比如 total = 2,那么 random.Next 的第二个参数在循环中的取值应该是 2,1。 如果end在这里不加1,则取值为1,0。取值为1,0,结果肯定是错误的。所以我感觉好像没有问题,我不清楚你说的矛盾是什么矛盾。
  • @viky88
    可以,参见下面链接
    http://www.cnblogs.com/eaglet/archive/2010/09/15/1826975.html
  • HubbleDotNet 推出一年多来,得到了大量用户的支持和使用,其中有些用户的搜索访问量较大,在使用过程中有时会因为同时并发访问过大,出现 Too many connects on server ...
  • @duxer
    看起来应该没问题,可能是你改了分词参数但没有重新索引,请重新索引一下试试。
  • DictManager 有个save as 的功能可以导出成 text 文件。多元分词,你词库中要有人工 和 流产 两个词,然后把冗余度设置为2 试试
  • @duxer
    你把这个句子用我这篇文章的方法分一下,看看会得到什么结果。
    上海高艺阀门有限公司(重庆办事处)
  • eaglet 评论博客:盘古分词-中文人名识别算法介绍 2012-03-19 20:12
    http://pangusegment.codeplex.com/
    访问不了吗?为什么你们拿不到源码?
Top