2009-12-12 18:20:39
Lucene简介
http://www.chedong.com/tech/lucene.html
Luncene初见索引、检索
http://topic.csdn.net/u/20080408/17/a9095641-b014-4223-9b68-6c694fd242f5.html
Luncene源码下载
http://apache.freelamp.com/lucene/java/lucene-3.0.0-src.zip
Luncene jar下载
http://apache.freelamp.com/lucene/java/lucene-3.0.0.zip
Lucene API
http://lucene.apache.org/
Luncene Demo解说
http://lucene.apache.org/java/3_0_0/demo
解决Luncene Demo中文无法索引
http://blog.eood.cn/archives/247/
Luncene FQ
http://wiki.apache.org/lucene-java/LuceneFAQ
Luncene索引HTML
http://wiki.apache.org/lucene-java/LuceneFAQ#How_can_I_index_HTML_documents.3F
Luncene索引OpenDocument (aka OpenOffice.org), RTF, Microsoft Word, Excel, PowerPoint,Visio, etc
http://wiki.apache.org/lucene-java/LuceneFAQ#How_can_I_index_file_formats_like_OpenDocument_.28aka_
OpenOffice.org.29.2C_RTF.2C_Microsoft_Word.2C_Excel.2C_PowerPoint.2C_Visio.2C_etc.3F
Luncene索引PDF
http://wiki.apache.org/lucene-java/LuceneFAQ#How_can_I_index_PDF_documents.3F
Luncene索引中文、日文、韩文
http://wiki.apache.org/lucene-java/LuceneFAQ#Can_I_use_Lucene_to_index_text_in_Chinese.2C_
Japanese.2C_Korean.2C_and_other_multi-byte_character_sets.3F
编码介绍
http://hi.baidu.com/baseetoo/blog/item/951b612a05ffd3f0e7cd406c.html
UFT8转换到GB2312
http://www.cnblogs.com/comsteed/articles/1126023.html
GB2312转换到UFT8
http://topic.csdn.net/t/20051026/10/4350730.html
获取文档编码
http://hi.baidu.com/i7521/blog/item/50d51d55166ecbcdb645ae01.html
http://dev.csdn.net/Develop/article/10/10961.shtm
http://dev.csdn.net/Develop/article/10/10962.shtm
阅读全文>>
2009-12-15 21:50:32
今晚搜狗输入法弹窗,我不小心点了确定安装了搜狗浏览器,在安装过程中我想点取消都没法点。好像那个弹窗也只有在右上角有常规的关闭按钮,中间只有确定。
进来看界面还算不错,那个独立页面防假死、防无响应也很创新,用了一会,明显感觉比IE6快(当前使用的PC是IE6)所以跑到贴吧看看大伙的体验,看要不要卸载它。不过呢,发现贴吧貌似有很多枪手。还有搜狗浏览器官网说永久免费,其前提应该是IE已经付费了吧(IE的Money应该包含在Windows中吧,当然很多人包括我都是用的D版,对它免费不免费没什么概念)
我开了搜狗浏览器20分钟左右,9个标签,一看任务管理器。发现这家伙吃了我65.46+54.57+10.20+13.85=163.88MB内存。其内存名称和所用内容如下:
setask.exe,65.46MB
setask.exe,54.57MB
setask.exe,10.20MB
SogouExplorer.exe,13.85MB
65.46+54.57+10.20+13.85=163.88MB
搜狗推出浏览器是说快(血本提供代理的原因?)、标签页独立稳定,360浏览器除了说快,更注重安全。看来他们都分了一杯属于自己的羹。
Chrome浏览器我也用了一段时间,感觉好多网页打开速度特慢(虽然Chrome运行JavaScript的速度很快),还有好多网页显示不正常(这个主要是由于chrome太标准化了,而网页制作者大多只编写适合IE的)
我平时都用Firefox,在它之前用遨游,有一段时间不知道是由于电脑出故障还是咋的,遨游一而再再而三崩溃(包括系统重装、浏览器换版本),所以不得不另觅一款浏览器。当时准备在IE7和Firefox上做选择。我就用手动方式测试:
不断地新建标签页,然后输入相同网址,直到浏览器崩溃或者反应超慢的时候为止,以最大标签数为衡量标准。当然创建标签的速度是能多快就多快。
结果发现:
IE7通常在10到20个的时候,就直接崩溃(不是无响应),而Firefox直到40个左右的时候才反应超慢或则偶尔崩溃,由此我对所有基于IE内核的浏览器都排斥了,那些采用了IE内核的浏览器再吹捧安全、稳定、快速都有其局限性;这也是为什么Chorme给我的印象虽然不好,但我相信它的发展空间。人家现在完全可以做更多贴近于用户的功能,而他们更关心的是内核,一个浏览器的内核在一定程度上决定着它未来的命运,这正是Google着眼于未来的网络操作系统的卓越眼光。
当我写这篇文章写到一半的时候(为了查看开了几个标签页),不小心把正在打字的标签页关闭了,习惯性(Firefox)地右击鼠标发现没有恢复关闭的标签页,觉得这一点还真的只有Firefox才有,我喜欢。
其实我喜欢Forefox的原因主要是由于其稳定性和扩展性,当然安全性不用说了吧,并且是开源、免费、跨平台的。比如上网上银行、支付宝什么的,需要使用IE才能正常访问,仅仅需要安装一个IE Tab,当访问这些特殊网站的时候,会自动切换到IE内核浏览模式;需要什么网络书签、导航什么的直接下载一个扩展就是了。近来我还发现了Fifefox的一个奇特之处当点击网络上的Email链接的时候,Firefox直接询问我是否选择Gmail、Yahoo,还是系统默认的邮件发送软件,而选择前两者似乎都直接打开相应的Email页面,如果账号已经登录,直接填写标题和内容,点击发送就是了,还真不错啊。
阅读全文>>
2009-12-29 11:59:17
有个很有趣的现象。比如买MP3,市场上几十上百(低于500)的Mp3比比皆是,可人们花了那个钱买了还是觉得赶不上上千元的iPod MP3真实奇迹啊,一个公司让成本只有数百RMB的产品卖你2000RMB,你还觉得自己那个酷、那个神气、那个得意,从来不认为自己是冤大头,难道不奇迹么?当然如果把iPod的核心技术算上,你会觉得不只那个价,可其成本又会比其他的Mp3贵得了多少呢?如果你认为独一无二是无价的,那我也没话说了。
又或者买一双Nike鞋吧,一听Nike,哇,挺牛的国际知名品牌,说不定你买的鞋子就在中国或者越南生产的。生产后送到美国打上标签,再运回中国销售,过了两次洋,这山鸡就变凤凰了。其实你吃的凤凰肉还是自己林子里长的山鸡。
又或者诺基亚、摩托罗拉手机吧,在未上壳之前,说不定就来自同一家生产厂家,可能其手机设计都来自同一家公司。不要以为诺基亚就比摩托罗拉强,他们或许在同一个厂家生产,甚至使用相同原材料。
为什么会发生这些奇怪的现在,人们宁愿花更多的Moeny去购买相同质量和性能的产品,仅仅因为他们是品牌或者服务(又有多少人真正享用了这些服务)。人们在购买这些品牌商品的时候除了商品的产品价值外,更获得了品牌价值,为了心理满足,必须为之付出代价的。
我不得不说,中国,真的缺少自己的品牌。生产环节的盈利是产品链中盈利最小的。可能这是中国当前国情决定的,但还是希望中国能多出几个具有国际竞争力的公司强调一下,当然不是中国移动、中国石油那种。
阅读全文>>