good good study, day day up
来源: BlogBus 原始链接: http://www.blogbus.com:80/blogbus/blog/index.php?blogid=2331 存档链接: https://web.archive.org/web/20041024215046id_/http://www.blogbus.com:80/blogbus/blog/index.php?blogid=2331
good good study, day day up aleung的学习笔记, aleung的idea 奢侈一下,买台液晶吧 -[杂谈] 时间: 2004-09-18 22:36 家里的显示器比较老了,用起来总是感觉不爽。我的电脑除去上网文字处理等日常使用外,用途主要是两个,照片编辑和GPS/GIS应用。现在的显示器两个不爽:一个是尺寸问题,15寸只能上800*600,用photoshop调整照片时就算把工具panel全部关闭也看不全,在OziExplorer里面看地图也嫌显示范围不够大。另一个是显示效果不佳,感觉不锐,总有点灰蒙蒙似的,颜色也不够艳丽。 最初想法是换个好些的CRT,不考虑液晶。一方面是液晶贵,另外“专业人士”都说在图像处理方面液晶比CRT还差得远。年初的时候了解过市场行情,才发现17寸的特丽珑已经停产了,钻石珑的好显示器也没有几款,CRT市场变成了高端和底端两个断层。贵的买不起,便宜的又不见得比现在用的好太多,就算了。 前几天在整理一些照片的时候,又被刺激了一下神经,更换显示器再次提上日程来。17寸CRT没有什么好选择,那么看看19寸,象点样子的都要三四千,而且这么大的显示器又笨重又占地方,再看看现在好些的LCD,效果也比以前改进不少了,不如还是LCD吧。还有,虽然现在都在宣传多少毫秒17寸液晶跌破3000元了,但是那些货色实际效果都只是一般的。看看人家推荐的型号,一查价格,哇,都是七八千的。一路看下来,将我的心理承受价位不断推高。我知道了,很多人就是这样一步步“中毒”的:) 网上看得不少了,今天去逛电脑城,看看实物是怎样的。每进一个店面,伙计都热情招呼,“想看些什么?CRT还是液晶”,“液晶,17寸的”,“哦,17寸液晶就是这款了,正在做特价……”,伙计往往都是指着最低档的一款向我介绍。显然,我的样貌打扮都象个学生。样品演示的大多都是严重ps过头的图片,艳丽无比,却毫无层次,每个LCD都像灯箱一样,看不出什么区别,估计大部分人也就是看看外形挑便宜的买吧。店员的水平通常也麻麻,除了不断重复12毫秒500比1之类的话外就说不出产品的其他优点了。也是的,懂得多的人也不会在电脑城买东西。有意思的是在一家店看sony的样品,我让店员放些图片来看效果,她找遍硬盘都没有找到,居然想到个点子,登录自己的163邮箱,把私人邮件里面的数码照片拿出来show。 我不玩游戏,也不打算用电脑来看电影,应用都是静态图像为主,因此刷新速度什么的并不重要,关键是色彩还原效果。主要看两方面,暗部层次表现和可视角度范围。如果观看位置上下偏一点,画面的明暗就有变化,这就不可接受了,调整照片的时候根本不知道应该以什么亮度为准。依照这个标准,电脑城里有样品演示的17寸主流产品几乎没有一个及格:( 唯一感觉很好的是samsung 173p,看来TN面版的可视角度都不行,PVA面版的才可以接受。至于暗部的表现能力,LCD比起CRT始终还是差一些,看灰阶都还比不上我现在用的这台低档CRT。 本来想看看高档产品的效果比较一下的,例如EIZO之类的无忌毒友老挂在嘴边的品牌,可是走了几个电脑城都没有看到有样品摆出来,卖的都是三星LG菲利浦等大众品牌。 看来选定的是173p了,就等广州市场什么时候降价――人家上海都卖4200了,广州还报五千多。 URL of this article | comments(1) | trackback(0) Picasa, 适合家用的图片管理软件 -[电脑使用] 时间: 2004-09-13 23:05 Google出品,必属精品。我发现我对google已经产生了一种不由自主的崇拜,从google search到gmail,blogger(可惜在国内被封),和这个picasa。也许,google是另外一个apple――拥有自己一群忠实的fans,形成了独特的文化。 Picasa 是最近google收购回来的一个图片管理软件。过去,图片浏览管理大多都是用ACDSee,picasa有什么不同?新的用户体验,就像gmail不同于其他webmail,不是拥有同样功能的仿制品,而是带来了一种新的资料管理(整理)模式。图片按照album组织,根据timeline显示,操作界面简单、舒服。据说,picase与mac的iPhoto类似,不过我没有iMac无缘试用iPhoto。 Picasa还有很多缺点,例如不能显示中文,无法显示EXIF信息,不能添加注释,不提供zoom... 目前它看来还不能替代ACDSee,但这个软件看来挺有前途,值得期待。 URL of this article | comments(0) | trackback(0) 用bayesian过滤来实现论坛发言自动检查 -[软件技术] 时间: 2004-09-06 23:21 Bayesian过滤已经广泛用于邮件系统的anti-spam功能中,通过统计分析出spam邮件词语的统计特征,实现自动识别。 根据这个思路,也可以将bayesian过滤用在论坛的发言检查中,以减少版主工作量。 考虑到要易于与现有论坛系统集成,发言过滤器可以做成webservice之类的服务,提供两个功能调用: void train(String content, boolean isMatch) boolean filter(String content) 前者让发言过滤系统学习,分析content特征;后者让系统分析content是否应该被过滤,返回值也可以是一个浮点数,表示分析出是敏感内容的可能性(确定性)。 对于论坛系统,如果本来已经支持版主审核功能的话,改造很简单。用户发言,调用filter方法,如果返回false,直接设置为已审核状态,直接显示;如果返回true,设置为待审核状态,等待版主人工审核。版主审核时,将选择是否需要过滤此内容,调用train方法,让过滤器学习。 Classifier4J 可以用于过滤器的开发,已经提供了Bayesian分类功能,需要补充的是中文分词的实现。 URL of this article | comments(1) | trackback(0) Mind map, FreeMind -[思考] 时间: 2004-08-25 18:08 Mind map,中文翻译为“思维导图”。听起来有点玄乎,说白了就是以图像方式记录思路或者描述事物的一种方法。(看看下面的图就有直观了解了)。在我的理解中,mind map是辅助整理思路和思维扩展的一个工具,一方面以层次化的形式将思路条理化,另一方面能快速记录下头脑中闪现的想法,特别适合于头脑风暴的场合。 两年前看到有关mind map的介绍,当时非常感兴趣,跑去图书馆把Tony Buzan的书借来看。惭愧的是,书放到过期都没有看几页,因为对那些心理学的理论不感兴趣。Tony Buzan在书中把这个方法吹嘘得神乎其神,我总觉得他有黄婆卖瓜之嫌。Mind map从本质上与outline(大纲)差不多,它的很多长处用outline也可以实现。但他说到人的大脑对于文字、图像、声音是由不同的区域处理的,图像的方式可以刺激大脑的特定区域,比单纯文字要好,对此我是很有体会的,一向以来我都比较喜欢以画图的方式来思考问题。 当时试用过几款mind map软件,最好的应当算是MindManager了,但用了一段时间,没有养成习惯,也就没有感觉到什么特别的好处,还是放弃了。后来我在需要整理思路的时候都是采用outline:如果写文档,在word里面采用大纲视图;日常的笔记,我喜欢用CyberArticle,它是使用HTML格式的,用列表或者项目符号也很方便的组织大纲;palm上也有类似的工具,但用得不多。如果需要记录思维,而不希望因为记录的过程而束缚思路,我更习惯用纸和笔。 其实不是mind map不好,而是这些软件在人机交互界面上都未能突破电脑与纸笔之间的隔阂。用手写画,眼睛看着纸上的图像获得反馈,是我们最习惯的方式。使用电脑之后,中间环节插入到这个过程中,大脑需要处理如何进行电脑录入,特别是当软件设计得不好,操作复杂,或者响应速度慢时,反馈过程立马被打断了,造成了思维的障碍。从这个角度看,tablet PC应当是优于键盘鼠标输入的普通电脑的,以前我曾经写过 这方面的想法 。 今天 flyisland 推荐的软件 FreeMind ,试用了一下,感觉很不错。 首先,功能简洁实用,虽然并没有MindManager那么强大,但是常用的都有了 使用简单,试了一个小时左右,大部分的功能都已经掌握了。学习曲线平缓,对于这样一种通用型工具很重要 使用非常方便,常用功能用键盘就可以控制,不需要鼠标,这样的操作界面可以进行快速记录,减少对思路的阻碍 虽然是用java开发的,内存占用不算多,运行速度也快。对mind map软件来说速度是很重要的,如果经常出现用户察觉到的等待,就没有什么使用价值了 Open source! 有关mind map和FreeMind,还可以看看flyisland的介绍。 http://www.blogbus.com/blogbus/blog/diary.php?diaryid=348523 这个就是我试用FreeMind时做的练习,同时也归纳出它的基本使用方法,希望能再进一步减少你的学习时间吧:) URL of this article | comments(0) | trackback(0) 可怜的腾迅 -[杂谈] 时间: 2004-08-04 13:43 所谓树大招风,腾迅这回可是中招了,面对愤青们打着爱国主义和民族主义旗号的攻势,却是苦水只能往肚子里咽。QQ的主要用户群是青少年学生,正是最热血沸腾的年龄,看来这次事件对腾迅的影响不可谓不大。 看看QQ游戏里面都过滤些什么单词吧,在QQ安装目录里面找出COMToolKit.dll这个文件,用VC把它打开(或者其它的能查看资源的工具,实在没有,用UltraEdit也可以,不过会夹杂着很多乱码),就可以看到有两个叫做“DIRTYWORD”的资源,id分别为9001和9002,在鼠标右键菜单中选择导出,把它们存入文件,用文本编辑器打开,怎样,大开眼界吧?好多词,我们这些良民百姓都不知道有什么含意。 可以看看 http://forum.future.org.cn/showthread.php?p=618922 的21楼(不知道最初出自哪里),有详细一点的介绍。作者是个反日派,他的结论也挺有意思: 从这个过滤词表看,可以得出几个结论:第一个结论,大家说话都不怎么流畅,全是他妈的弱势群体,谁也别笑话谁。以后坛子上的反腐斗士和自由派,别老拿这个来数落俺们反日派。俺们也互相体谅。第二个结论,政府对民族主义算是比较纵容的了,虽然也提防着,但主要也就提防大家上 街,网上骂骂,一般来说是安全的。第三个结论,别骂腾讯。尽管腾讯的发家有那么些不光彩的地方,但这事怪不了它。不负责任胡乱攻击只会给我们多树敌人。 最后一段是奉劝我们自己人的。第一句话是奉劝新网友的。新网友别每天就知道灌水起哄,“把腾讯移交有关部门处理”啥的,惹人家笑话。不管你将来准备加入什么思潮流派,第一步应该是了解自己的处境,别以为教科书上说你是国家的主人,你就真的信了。了解了自己的处境,才能改变它。第二句话是奉劝老网友的,过滤词什么的,大家在网上混那么多年的,都知道是谁干的,老虎谁都不敢打不敢骂,这也没什么丢脸的,不敢骂就不敢呗,抓住一只小猫暴扁干嘛?充英雄吗?表演自己的怯懦而已。 URL of this article | comments(0) | trackback(0) 语音浏览技术规范简介 -[软件技术] 时间: 2004-07-09 16:59 一直以来,在CTI领域语音应用的开发都是采用各厂商的专有技术的,每个平台厂商都伴随自己的平台推出一套语音业务开发的规范,有些是脚本式的语言,有些是图形化的流程,这些规范受限于平台,相互之间没有兼容性,基于这些专有规范开发出来的语音业务很难从一个厂商的平台移植到另一个厂商的平台。 另外一方面,这些专有的语音业务开发规范的体系是非开放性的,业务控制局限在语音平台内部,与外界系统进行交互只能通过有限的途径,例如访问数据库、数据访问网关,开发COM接口组件等。造成难于与外部系统有机集成,集成成本高。在业务开发上,也因为业务处理逻辑与用户交互控制混合在一起,使得复杂业务的开发难度和维护难度都比较高。 近年来,随着网络技术的发展,各种业务应用都纷纷往网络方向发展,充分利用internet的数据自由流动和协议标准化的优势,CTI技术与web技术融合的需求越来越大。基于web的各种开发技术也迅速发展并成熟,包括J2EE、.NET、WebService等等,web应用开发渐渐变得快捷而高效。另外一方面,随着手机、PDA等手持设备的发展,对于延伸使用者界面,多模式互动的需求越来越多,提供键盘、笔输入、语音等多种输入手段,各种文字、影音输出途径,语音应用和传统文字/图形应用的界限越来越模糊。 在这样的趋势下,业界研究推出了多种涉及语音技术的标准规范。其中,W3C(World Wide Web Consortium)走在前面,其下的语音浏览器工作组等多个工作组进行的标准规范制定工作都涉及了语音技术。目前,对于电话和语音应用领域,重要的规范有三个,分别为VoiceXML, CCXML(Call Control eXtensible Markup Language), SALT(Speech Application Language Tags)。 这三个规范都是基于XML的,这是因为XML作为一种可扩展的通用标记语言,有着标准化、结构化的特点,并且对于XML的生成、传输、解析、验证、查询都已经有一系列相当成熟的技术和编程开发包,存在着很大的优势。但XML本身并不说明什么,它只是用来描述规范的一种语言,支持XML跟支持VoiceXML、CCXML这些规范是完全两回事。 这三个规范应用在系统中,部署架构基本是相同的,从高层次来看,由两个主要模块构成:文档服务器(document server)和电话语音平台(speech/telephony platform)。文档服务器由web server、database server、application server等构成,可以使用J2EE或者.NET平台。业务应用部署在文档服务器上,它响应电话语音平台发送来的请求,生成XML规范文档。电话语音平台包括了解释器、TTS、ASR等部分,它解释执行文档,负责与用户的交互界面。 电话语音平台与PSTN接口,或者提供VoIP支持。当一个呼叫进入系统,电话语音平台分析出业务类别,通过HTTP协议向文档服务器发起请求。文档服务器执行业务应用,生成VoiceXML或者CCXML规范的文档,返回给电话语音平台。电话语音平台内置了VoiceXML或者CCXML浏览器,解释执行文档内容,控制ASR与TTS操作,与电话用户进行交互。TTS服务器将文字合成为语音,播放给用户;ASR服务器接受用户的语音输入,利用语法规则(grammar)将用户说话内容识别为文本数据,平台在脚本控制下根据输入内容判断下一步的执行。 大多数情况下,基于web的应用都会采用易于扩展的架构,将核心服务逻辑(业务逻辑)与表示细节(VoiceXML, CCXML, SALT, HTML, WML)分离开。某些场合下还会将应用对话状态的维护与表示层分离,以实现表示语言机制的无关性,这样同一个应用可以采用web(HTML)、wap(WML)、语音(VoiceXML/CCXML)等不同的表示形式,适应PC、PDA、电话等多种用户终端。 使用这些XML系列标准技术规范的系统与过去传统专有规范的系统在架构上有所不同,使用标准规范的系统,业务的部署与平台的部署是分离的,相互通过HTTP协议松耦合,业务采用URL进行定位。这使得业务的分布部署变得非常简单。业务的开发采用web应用开发完全相同的模式,使得语音业务开发人员可以充分利用web应用开发的技术和经验。并且,用较小的代价就可以实现语音应用与web应用集成,或者实现应用的多种表示形式,适应不同的客户终端。 VoiceXML VoiceXML可以理解为另外一种表示语言,类似于HTML和WML。它是一种表述对话(dialog)的语言,用来控制业务过程中的人机交互过程,适用于面向电话、手机等终端设备的语音应用,例如自动客户服务、自助查询系统、个人消息系统等。 将VoiceXML与HTML对比,就能很容易理解了。浏览器解释后,HTML表示的内容是以文字图像方式显示在屏幕上的,VoiceXML的内容是以语言的方式播放给用户的。HTML接收用户的文字输入和鼠标点击,VoiceXML接受用户的语音输入,进行语音识别,或者是通过电话按键输入DTMF数据。 VoiceXML是一种独立的语言,不能内嵌到现有的web语言中(如HTML,WML)。