单从安全性角度出发,freebsd是比较好的选择,目前新浪、网易等综合门户使用较多,但是熟悉该系统的人相对较少。
由于redhat以后将不会再推免费的linux,而且其安全性和稳定性也并不是比windows高出很多,因此完全使用linux也需要慎重考虑。 windows 尽管口碑较差,但在实际应用中很多大的门户中仍有大量的windows服务器存在,包括搜狐、千龙等,如果有比较认真负责的系统管理员,windows 2000及其后续产品的综合成本还是最低的。而且包括windows系统资源占用过高等问题都可以通过比较专业的调优工作得到大幅度改善。一台 windows 2000的iis服务器在调优前后的性能差异可以高达数十倍。
建议采用freebsd或windows 2003中的一种统一操作系统,以降低整个网站的维护成本。 2.2 异构应用
xx局对外提供了很多种服务,其中社区、论坛、婚介、邮件等均是使用asp写的程序,而软件下载则是使用jsp写的程序,xx局内部的发布系统iflow也是基于的系统。
为了保证跨平台应用和未来的迁移扩展,还是建议将程序写成版本,目前越来越多的web程序员均精通asp、jsp、php等多种脚本语言,改写起来非常方便。
当然,应用程序的异构并不是太大问题,大多数网站都存在这种情况,但是应用程序编写的水平高低常会造成应用层安全漏洞,从而威胁整个网站的安全,如果在成本有限的情况下,考虑低成本的php也不失
为好的方案。 2.3 异构数据
发布系统iflow使用的数据库是windows版的oracle,而网站使用的动网论坛则使用的是access或sqlserver,如果按照清华万博的建议,将会把发布系统数据库迁移到mysql上。
从数据库的性能上而言,oracle是当之无愧的最佳选择。而ibm的db2和微软的sqlserver 2000也表现不错。千龙网到2003年5月以后才将部分数据库开始向oracle迁移,而此前的应用一直是在sql server 2000上运行,效能是令人满意的。
而mysql和access在多数方面与上述的大型数据库是无法比拟的,例如可以大幅度提升数据库查询性能的存储过程、可以防止数据库错误发生的事务处理等高级性能它们都不支持。mysql的下一个版本虽然声称会加入这些性能,但未经过长期考验的数据库性能是不能令人信服的。
因此将oracle数据库换成mysql是不明智的,应该说是一种倒退。而且将三个月以前的数据切断也不是好的做法。要知道对于一个新闻网站而言组织历史数据制作专题报道是非常重要的吸引网民的手段,也是作为新闻门户的立身之本。这就决定了切分历史数据将会给编辑的工作带来极大的不便。
与sqlserver自动调优不同的是,oracle数据库对人工优化的依赖程度特别高,默认的安装选项几乎发挥不出oracle数据库性能的十分之一,而且oracle是支持群集和海量数据的最佳选择,如果想快速发展
的话,更没有理由不使用它了。
xx 局目前数据库内的数据量为39万条,目前所购小型机已过了三年保修期,按xx局运行三年算,平均每天的新闻发稿量不到340条(当然发稿量一定是个渐近的数字,但就算平均到一年,每天也不过1050条左右),这一数字与千龙网、东方网每天的3000-5000条和新浪、搜狐每天的5000-10000条相比,根本算不了什么,因此绝不可能是因为数据库本身的性能影响了系统的速度。
如果iflow系统可以从oracle移植到mysql上的话,那只能说明这套系统根本就没有就oracle数据库做过优化,没有利用任何大型数据库提供的高级功能,因此其访问效率必然十分低下。 2.4 网站结构
事实上财经频道根本就不存在江苏频道里的内容。这说明了iflow生成的目录结构存在非常致命的问题,就是在同一天所有频道的内容都被混放在同一个目录中,然后通过不同的虚拟主机让用户产生不同频道的错觉,事实上根本没有办法把这些文件拆分开。
这样的话,就没有办法轻易实现象新浪、搜狐、千龙那样的分布式结构,即每个频道都可以单独地采用一台或几台服务器,从而承载每天千万级甚至是亿级的访问量。这将会给未来的系统改造带来极大的麻烦。
虽然使用完全对等的多台web服务器也可以实现负载均衡,但过度的冗余最终还是会影响到整个网站的性能。而且根据经验,这一拆分工作是十分艰巨的,估计至少会花费一个程序员三、四个月的时间。
这个问题也是必须解决的问题,是大型网站发展的重大瓶颈问题。 2.5 内容海量
根据刚才的分析,xx局目前的新闻更新量并不是很大,按照大多数新闻网站的发稿标准,每人每天的额定工作量应该是50篇新闻,如果要达到千龙、东方每天 3000-5000篇的发稿量,应该至少保证60-100人的编辑队伍,而要达到新浪、搜狐每天5000-10000篇的发稿量,应该至少保证100- 200人的编辑队伍。
事实上这些网站根本就没有使用这么多的编辑。大多数网站,包括新浪、搜狐、千龙等均使用同一个自动信息采集软件(目前国内唯一能做到实用的,也是这几家大网站都统一使用的软件叫作newshoo,尽管同类的采集产品很多,但都无法达到预期的采集效果)与内容管理系统对接,直接将合作媒体的网站信息采集和自动发布,每天可以完成近50%的工作量,从而大大提高了发稿数量,降低了人力成本。 2.6 内容深度
仅从梅艳芳逝世专题而言,xx局的专题丰富程度比起新浪、搜狐和千龙而言都有极大差距。一方面可能与发布系统的表现管理和专题组织速度有关,另一方面也与历史数据有关。由于几大门户网站一直在使用newshoo软件采集来自互联网上的信息并输入到自身的发布素材库中,因此编辑可以轻易找到很多可用素材,并且不必象在google上搜索一样要经过拷贝、粘贴、整理就可以直接使用。 2.7 服务深度
xx局提供了很多服务内容,从提出的改造需求看,改造后的服务广
相关推荐: