2003年中国互联网络信息资源数量调查报告_中国互联网络信息中心

2020-02-27 调查报告 下载本文

2003年中国互联网络信息资源数量调查报告由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“中国互联网络信息中心”。

信息资源数量调查报告 主持单位:xx信息办推广应用组 承办单位:中国互联网络信息中心 完成时间: 2004年2月(本文图均略)目 录 第一部分 调查背景1 第二部分 调查说明2

一、调查对象2

二、调查内容2

三、调查时间3

四、有关概念3

五、调查方法4

六、调查问卷7

七、组织单位7 第三部分 调查结果9 第一章域名、网站数及地区分布9

一、域名数9

二、网站数10 第二章网站性质及服务内容12

一、网站按性质分类12

二、网站的基本情况13

三、各类型网站信息服务内容及信息更新情况29 第三章网页数量及性质特征60

一、全国网站的网页情况60

二、国内前100家大型网站的网页情况63

三、全国网站的网页与国内前100家大型网站的网页情况比较65 第四章在线数据库数量及性质67

一、在线数据库数量及各类网站拥有在线数据库情况67

二、在线数据库按内容和记录数分类情况70 第五章总结79

一、域名统计79

二、网站统计79

三、网页统计85

四、在线数据库统计86图目录 图 1 地区域名数量分布10 图 2 www.daodoc.com域名(含ORG.CN,GOV.CN,EDU.CN等)下的所有网站。

二、调查内容 表 1 调查内容和指标 指标数据来源备注 域名数量CNNIC数据+注册商上报网站数量CNNIC数据+注册商上报 网页数量计算机自动搜索 在线数据库数量问卷调查 域名各地区域名分布状况CNNIC数据+注册商上报网站各地区网站分布状况CNNIC数据+注册商上报按照省级行政区域划分 各种性质的网站分布状况按照网站的域名特征划分 主要类型网站提供的服务问卷调查政府、商业、企业 各行业网站分布状况按照标准行业分类法 网站相关特征每天页面访问数 服务器拥有情况 网站的链接数 网站的员工数 网站成立时间频道数 网站版本 网站的可访问性网站地图等 安全性防火墙、操作系统等 网站效果指标信息发布可用性度量 业务结合 网页网页按内容形式分类比例计算机搜索包括图像、音频和视频 网页按性质分类比例政府、企业、商业等 网页按地域分布比例省域及七大区分布 网页长度以字节数计算 网页的更新周期 网页编码状况简、繁体中文、英文等 在线数据库按性质分类比例问卷调查政府、企业、商业网站等 按地域分布比例华北、华南等七大区分布 按内容分类比例产品、科技信息数据库等 按形式分类比例图形文字数据综合等 按使用情况分类比例分自用和公用 公用下分免费和收费 收费下分收费方式 按服务方式分类比例面向终端用户或中介 在线数据库更新状况- 数据库容量物理存储量(G)是否同时具有其它载体 否、是(光盘、纸质等)

三、调查时间 调查时间:2003年12月-2004年2月;数据截至时间:2003年12月31日。

四、有关概念 1.在本次调查中,中国互联网络信息资源定义为:中国互联网络上公开发布的网页和在线数据库的总和。2.中国互联网络是指所有域名注册单位属于中国大陆的网站总和。3.在线数据库是指以Web为界面,提供公共检索的收费或免费的数据库。4.网站是指有独立域名的web站点,其中包括CN和通用顶级域名(gTLD)下的web站点。此处的独立域名指的是每个域名最多只对应一个网站www.daodoc.com来说,它只有一个网站 www.daodoc.com、mail.sina.com.cn……等多个网站。5.商业网站指业务主要在网上进行的电子商业网站,如新浪、搜狐、网易等网站;企业网站是相对于商业网站而言,指业务主要在网下进行的企业所建立的网站,如联想集团的网站 www.daodoc.com域名(含ORG.CN,GOV.CN等)下的所有网站。2.抽样框 关于抽样框,最直接的作法是选择抽样框为全国有域名的网站名录。由于保密性的原因,抽样过程需要委托各域名注册/代理商完成,从方便实施并提高数据精度的角度考虑选择抽样框为全国(不含港、澳、台)范围内的域名名录。由于一个网站可能会有两个或两个以上域名,而有的域名没有建立网站。这样对于总体而言,就出现了抽样框单位没有对应的抽样单位、抽样框单位和抽样单位不一一对应等问题。对此,考虑采用排除、事后加权等方法来解决。3.抽样方法 本次调查的抽样方法采用分层按比例抽样:考虑到各域名类别下网站特征的差别,首先按域名类别分层;之后在每个类别内采用定距抽样的方法来抽取样本,最后对调查结果进行事后加权处理以估计全国范围的估计量。下面分阶段叙述抽样方法: 第一阶段:将样本量分到各层 因为到目前(2003年11月)为止只有截止2003年6月30日的全国范围的域名数的情况;同时考虑到我们主要是利用各类别域名数之间的比例关系来确定样本量在各层的分配,而这种关系应该不会有较大的变化。因此本方案按照截止2003年6月30日的各类别域名数占全国域名总数的比例将样本总量分配到各域名类别。第二阶段:将样本量分配到各域名注册/代理商 抽样过程由域名注册/代理商按照抽样办法(由中国互联网络信息中心提供)抽取指定数量的域名作为样本。样本按照各域名注册/代理商所注册拥有的域名数的比例进行分配。具体计算办法如下: M ij =Mj×(Nij /Nj)其中:M ij表示第i家域名注册/代理商所应抽取第j类的域名数,M j表示第j类应抽取的域名样本数,Nij表示第i家域名注册/代理商所拥有第j类的域名总数,Nj表示第j类的域名总数。第三阶段:各家域名注册/代理商抽取域名样本 考虑到尽可能简化各域名注册/代理商抽取样本的工作量和保证抽样的精度,要求各域名注册/代理商在整理了域名名录(抽样框)后采用等距抽样,抽取样本步骤如下: 步骤1:分组 以域名的类别为单位对域名名录进行分组。步骤2:排序 由域名注册/代理商对其抽样框(域名名录及相关信息)内各组域名首先按照域名注册单位所属省份排序,进而在域名注册单位所属省份下按域名注册先后时间进行排序。步骤3:编号 对各组内完成排序的域名进行编号。域名注册单位所属省份排序和编号规则规定如下: 序号省市区序号省市区序号省市区序号省市区 1北京9上海17湖北25云南 2天津10江苏18湖南26~ 3河北11浙江19广东27陕西 4山西12安徽20广西28甘肃 5内蒙古13福建21海南29青海 6辽宁14江西22重庆30宁夏 7吉林15山东23四川31新疆 8黑龙江16河南24贵州 步骤4:抽取样本 以第i个域名注册/代理商、抽取第j类样本的过程为例叙述如下。第i个域名注册/代理商在第j组域名列表中抽取出指定数量的Mij个域名作为其提供的第j类域名的样本,抽取的规则如下:首先计算一个抽样距离XIJ(XIJ=Round(nij/Mij)),XIJ为第i个域名注册/代理商在第j类样本中的抽样间距,然后随机从1到nij中选出一个数S,那么编号为p=S+k*Xij(k=0、1、2、3 M ij-1)的域名即为被抽取的样本域名(当p>nij时,取p=p-nij)。其他组的样本抽取过程类似,将各组中抽取到的样本综合到一起可组成第i个注册/代理商应抽取的样本。步骤5:获取样本相关资料 将以上步骤所抽取的样本域名及其相关信息(包括:域名、域名类型、域名注册时间、域名所属单位、域名单位所在地、域名联系人、联系电话等)存为Excel工作表文件。格式如下: 序

号域名域名类型域名注册时间域名所属单位域名单位所在地联系人及联系方式 1cnnic.net.cnNet北京将所有注册/代理商提供的样本合并即成为调查所需样本。

六、调查问卷 本次问卷调查的有效网站样本数为2492个,在置信度为95%的精度要求下,可保证最大允许绝对误差小于2%。调查问卷时间为2003年12月-2004年2月。问卷所采集数据的相应记录时间为2003年12月31日。

七、组织单位

1、委托单位: xx信息化工作办公室

2、实施单位: 中国互联网络信息中心(CNNIC)

3、协助单位(按字母排序): 百度在线网络技术(北京)有限公司 北京东方网景信息科技有限公司 北京信海科技发展公司 北京信诺立兴业网络通信技术有限公司 创联万网国际信息技术(北京)有限公司 东方通信股份有限公司 搜狐爱特信信息技术(北京)有限公司 厦门必信电脑网络有限公司 厦门精

《2003年中国互联网络信息资源数量调查报告.docx》
将本文的Word文档下载,方便收藏和打印
推荐度:
2003年中国互联网络信息资源数量调查报告
点击下载文档
相关专题 中国互联网络信息中心 调查报告 信息资源 年中 中国互联网络信息中心 调查报告 信息资源 年中
[调查报告]相关推荐
    [调查报告]热门文章
      下载全文