<?xml version="1.0" encoding="UTF-8" ?>
<rss version="2.0">
<channel>
<title>百里挑一</title> 
<link>http://www.admin99.net/index.php</link> 
<description>linux命令 &#124; seo优化技术 &#124; linux系统管理员指南 --我的学习园地</description> 
<language>zh-cn</language> 
<copyright>Powered by Bo-blog 2.0.2 sp2</copyright>
<item>
<link>http://www.admin99.net/read.php?219</link>
<title>awstats安装与初级配置</title> 
<author>real &lt;real@admin99.net&gt;</author>
<category>awstats</category>
<pubDate>Wed, 20 Dec 2006 09:22:55 +0000</pubDate> 
<guid>http://www.admin99.net/read.php?219</guid> 
<description>
<![CDATA[ 
	首先到awstats的官方网站http://awstats.sourceforge.net下载最新版的awstats，目前已有的是awstats-6.6,是beta版的。此次说明以这个版本为准。<br/>1。下载<br/> &nbsp; &nbsp;wget http://awstats.sourceforge.net/files/awstats-6.6.tar.gz /usr/local/src<br/>2。解压<br/> &nbsp; &nbsp;tar xzvf /usr/local/src/awstats-6.6.tar.gz -C /usr/local/awstats<br/>3。安装<br/> &nbsp; &nbsp;有几点需要注意，安装过程中awstats会修改apache的配置文件，如果不确定能否成功请先备份apache配置文件。awstats默认安装在/usr/local/awstats这个目录中，如果当前不在这个目录下，最好把所有的安装文件mv到这个目录，这样会省去很多麻烦。另外，awstats会建议你将apache的配置文件中的日志格式从common改为combined，最好按照它的建议，同样能省去很多麻烦。然后awstats会提示创建一个配置文件（如果是第一次安装的话）。最后就是它会自动重起apache。其它没什么，只要看的懂E文应该没什么问题。<br/> &nbsp; &nbsp; cd /usr/local/awstats/tools<br/> &nbsp; &nbsp; &nbsp; &nbsp;./awstats_configure.pl<br/> &nbsp; &nbsp; &nbsp; 按照提示一步一步做下来，很快。我创建了配置文件叫做awstats.admin99.conf，存放在/usr/local/awstats/wwwroot/cgi-bin/下。<br/><br/>4。编辑配置文件<br/> &nbsp; vi /usr/local/awstats/wwwroot/cgi-bin/awstats.admin99.conf<br/> &nbsp; &nbsp; 修改几处基本信息<br/> &nbsp; 首先确认logtype和logformat是否与apache的一致，DirData设置的目录是否可写<br/> &nbsp; SiteDomain= #此处是你的域名<br/> &nbsp; LogFile= #此处是你的日志文件的具体位置<br/>5。测试<br/> &nbsp; /usr/local/awstats/wwwroot/cgi-bin/awstats.pl -config=admin99 -update<br/> &nbsp; &nbsp;如果没有报错<br/> &nbsp;再看看http://yourdomain/awstats/awstats.pl?config=admin99<br/> &nbsp; 如果能看到页面，那就大功告成了：）<br/> &nbsp; 如果需要生成静态页面<br/> &nbsp; /usr/local/awstats/tools/awstats_buildstaticpages.pl -awstatsprog=/usr/local/awstats/wwwroot/cgi-bin/awstats.pl -config=admin99 -lang=cn -dir=/home/awstatsresult -update -builddate=%YY%MM%DD<br/><br/>其中-dir是放置静态页面的目录，同样要保证可写<br/>Tags - <a href="http://www.admin99.net/tag.php?tag=awstats" rel="tag">awstats</a>
  ]]> 
</description>
</item><item>
<link>http://www.admin99.net/read.php?203</link>
<title>awstats 日志分析在跨月时的一个处理小技巧</title> 
<author>real &lt;real@admin99.net&gt;</author>
<category>awstats</category>
<pubDate>Fri, 01 Dec 2006 07:02:40 +0000</pubDate> 
<guid>http://www.admin99.net/read.php?203</guid> 
<description>
<![CDATA[ 
	awstats 日志分析在跨月时的一个处理小技巧<br/><br/>一直使用awstats来分析apache的日志，在crond里使用这样的命令来处理前一天的日志/usr/local/awstats-6.4/tools/awstats_buildstaticpages.pl -awstatsprog=/usr/local/awstats-6.4/wwwroot/cgi-bin/awstats.pl -config=admin99 -lang=cn -dir=/home/awstatsresult -update -builddate=%YY%MM%DD，结果发现，前一个月的最后一天的分析结果一直看不到。<br/> &nbsp; &nbsp;因为处理每月最后一天的日志的时候，已经是下个月1号的凌晨了，awstats虽然建立了当天的分析页面，却不知道该把分析的昨天的结果写在什么地方，因此看不到最后一天的统计结果<br/> &nbsp; &nbsp;找来找去，终于找到了办法，就是在处理前一个月最后一天的日志的时候，在原有的命令行的基础上，加上一个-month参数，让awstats生成一个月的日志分析结果。在这个操作中，awstats并没有做比平时多的事情。<br/> &nbsp; &nbsp;例如上面的例子中，加入-month参数后(分析11月最后一天)<br/> &nbsp; &nbsp;/usr/local/awstats-6.4/tools/awstats_buildstaticpages.pl -awstatsprog=/usr/local/awstats-6.4/wwwroot/cgi-bin/awstats.pl -config=admin99 -lang=cn -dir=/home/awstatsresult -update <span style="color: #FF0000;">-month=11</span> -builddate=061131<br/> &nbsp; &nbsp; 之所以把 -builddate设置为061131（其实没有这一天的）只是为了延用个人以前的习惯，在awstats存放分析结果的静态页面的目录中做了一个index.htm文件，方便随时跳转到某天。<br/> &nbsp; &nbsp;网上有很多人都把month参数设置为-month=$M，究竟该如何设置应该看自己的实际情况，像我这样的情况，awstats每天分析前天的日志，只能将-month设置为上个月<br/> &nbsp; &nbsp;语言能力不够强，不知道说清楚了没有<br/>Tags - <a href="http://www.admin99.net/tag.php?tag=awstats" rel="tag">awstats</a>
  ]]> 
</description>
</item><item>
<link>http://www.admin99.net/read.php?109</link>
<title>awstats统计结果中除去gb2312 sitehao123等关键字</title> 
<author>real &lt;real@admin99.net&gt;</author>
<category>awstats</category>
<pubDate>Thu, 26 Oct 2006 09:14:15 +0000</pubDate> 
<guid>http://www.admin99.net/read.php?109</guid> 
<description>
<![CDATA[ 
	awstats统计结果中除去gb2312 sitehao123等关键字<br/><br/>该文章在车东的文章基础上修改而成<br/>从上7月开始：我发现自己的AWStats统计中出现了gb2312、sitehao123、baidu、myie2dg这个关键词而且量很大：<br/>gb2312 7955 27.1 % <br/>sitehao123 1891 6.4 % <br/>baidu 387 1.3 % <br/>myie2dg 360 1.2 % <br/>泡泡堂看电影 354 1.2 % <br/>503316480 187 0.6 % <br/><br/>但无论从那个搜索引擎上搜，通过这几个关键词也找不到我的页面啊？检查了一下统计，gb2312从6月份的统计中就开始有了。仔细检查了一下apache的原始日志：从来源看，应该是来自百度的搜索结果页：<br/>"http://www.<br/>baidu.com/s?lm=0&si=&rn=10&ie=gb2312&ct=0&wd=silence22&pn=10&cl=3"<br/>http://www.baidu.com<br/>/baidu?align=left&width=520&leftmargin=5&cl=3&tn=baiducnnic&word=%BD%AD%CB%D5%BE%AD%BC%C3%CC%A8%C4%D0%C9%FA%CB%DE%C9%E1<br/>http://www.baidu.c<br/>om/s?wd=%BC%D2%BE%DF%BC%D7%C8%A9%D6%CE%C0%ED&lm=0&si=&rn=10&tn=9991com&ie=gb2312&ct=0&cl=3&f=1&rsp=3<br/>http://www.baidu.co<br/>m/s?tn=myie2dg&ie=gb2312&bs=baidu&sr=&z=&cl=3&f=8&wd=%CE%C0%C9%FA%BC%E4++%B4%F3%C3%C5+%B7%E7%CB%AE&ct=0<br/><br/>其中<br/>tn是百度的合作网站代码<br/>ie表示input encoding：表示输入字符串的字符集<br/>ct不知道，大部分有ct的都是从image.baidu.com来得搜索<br/>align=left表示是从搜索结果的左侧（右侧一般是竞价的关键词）<br/>bs=baidu大概表示baidu search<br/>而AWStats中有一个选项：<br/>LevelForKeywordsDetection=2 # 0 disables Keyphrases/Keywords detection.<br/>当设置为2的时候，会将来源网址中的所有参数进行遍历和自动识别，容易将一些其他参数的值当成关键词参数，这样的统计结果会丢失来源中实际的关键词。<br/><br/>解决方法：<br/>除了修改awstats.pl代码外，awstats其实在search_engines.pm中有一个参数列表定义：专门用于过滤掉可能产生歧义的参数列表：WordsToCleanSearchUrl<br/>@WordsToCleanSearchUrl= ('act=','annuaire=','btng=','cat=','categoria=','cfg=','cof=','cou=','count=','cp=','dd=','domain=','dt=','dw=','enc=','exec=','geo=','hc=','height=','hits=','hl=','hq=','hs=','id=','kl=','lang=','loc=','lr=','matchmode=','medor=','message=','meta=','mode=','order=','page=','par=','pays=','pg=','pos=','prg=','qc=','refer=','sa=','safe=','sc=','sort=','src=','start=','style=','stype=','sum=','tag=','temp=','theme=','type=','url=','user=','width=','what=','&#92;&#92;.x=','&#92;&#92;.y=','y=','look=');<br/>将tn=、ie=、bs=、ct=、align=、加入到其中：<br/>以后输出的参数中就不会有gb2312、sitehao123、baidu、myie2gd和tn=的值了。<br/><br/>以下是使用新WordsToCleanSearchUrl过滤参数的统计结果：<br/>夏娃的诱惑续集 40 1.3 % <br/>泡泡堂看电影 36 1.1 % <br/>免费新电影 25 0.8 % <br/>军歌嘹亮下载 16 0.5 % <br/><br/>Tags - <a href="http://www.admin99.net/tag.php?tag=awstats" rel="tag">awstats</a>
  ]]> 
</description>
</item><item>
<link>http://www.admin99.net/read.php?14</link>
<title>awstats include 多站点日志统计</title> 
<author>real &lt;real@admin99.net&gt;</author>
<category>awstats</category>
<pubDate>Thu, 12 Oct 2006 10:38:06 +0000</pubDate> 
<guid>http://www.admin99.net/read.php?14</guid> 
<description>
<![CDATA[ 
	awstats 是一款非常优秀的日志分析软件，在官方网站<a href="htp://awstats.sourceforge.net" target="_blank">awstats.sourceforge.net</a>提供awstats免费的下载，目前为止，最新的测试版本为awstats6.6，最新的stable版本为awstats6.5。<br/><br/>AWStats自带了一个批处理工具：tools/awstats_updateall.pl，可以批量地遍历一个目录下所有地配置文件并运行统计。因此剩下的工作就主要是日志的同步问题了。<br/><br/>针对多个站点，很多配置选项是重复的，如果每个配置文件都修改维护起来会很麻烦，AWStats从5.4版本开始提供了配置文件包含的功能，所以我们可以配置一个通用配置，比如：config.inc<br/><br/>然后其他站点的配置设置为：<span style="color: #FF0000;">可以通过后面的选项覆盖和缺省不一致的配置。</span><br/>awstats.bbs.conf <br/>Include "config.inc"<br/>LogFile "/path/to/bbs_log"<br/>SiteName "bbs.admin99.net"<br/><br/>awstats.www.conf<br/>Include "config.inc"<br/>LogFile "/path/to/www_log"<br/>SiteName "www.admin99.net"<br/>HostAliases="admin99.net"<br/>Tags - <a href="http://www.admin99.net/tag.php?tag=awstats" rel="tag">awstats</a>
  ]]> 
</description>
</item><item>
<link>http://www.admin99.net/read.php?13</link>
<title>awstats 日志统计指标说明</title> 
<author>real &lt;real@admin99.net&gt;</author>
<category>awstats</category>
<pubDate>Thu, 12 Oct 2006 10:34:20 +0000</pubDate> 
<guid>http://www.admin99.net/read.php?13</guid> 
<description>
<![CDATA[ 
	awstats是一款非常优秀的日志分析工具。在官方网站<a href="http://awstats.sourceforge.net" target="_blank">http://awstats.sourceforge.net</a>提供awstats免费下载，最新stable版本为awstats6.5<br/>1。参观者：按来访者不重复的IP统计，一个IP代表一个参观者；<br/>2。参观次数：一个参观者可能1天之内参观多次（比如：上午一次，下午一次），所以按一定时间内（比如：1个小时），不重复的IP数统计，参观者的访问次数；<br/>3。网页数：不包括图片，CSS, JavaScript文件等的纯页面访问总数，但如果一个页面使用了多个帧，每个帧都算一个页面请求；<br/>4。文件数：来自浏览器客户端的文件请求总数，包括图片，CSS，JavaScript等，用户请求一个页面是，如果页面中包含图片等，所以对服务器会发出多次文件请求，文件数一般远远大于文件数；<br/>5。字节：传给客户端的数据总流量；<br/>6。来自REFERER中的数据：日志中的参考（REFERER）字段，记录了访问相应网页之前地址，因此如果用户是通过搜索引擎的搜索结果点击进入网站的，日志中就会有用户在相应搜索引擎的查询地址，这个地址中就可以通过解析将用户查询使用的关键词提取出来：<br/><br/>AWStats在搜索引擎的关键短语和关键词统计方面的功能还是比较完整的：可以对全世界3百多种机器爬虫进行识别，并且可以识别大部分主流国际化搜索引擎和很多地区的本地语言搜索引擎。<br/>Tags - <a href="http://www.admin99.net/tag.php?tag=awstats" rel="tag">awstats</a>
  ]]> 
</description>
</item>
</channel>
</rss>