发布时间: 2024-03-31 07:53:05 | 作者: 高校/中小学
经济学的量化趋势使得数据在日常经济学研究中的地位愈加重要,经济学者们也慢慢变得依靠数据库尤其是微观数据库进行学术研究。小编现将中国第一个学术性社会跟踪调查项目——北大中国社会科学调查中心进行介绍,并对国内常用的微观数据库的主要信息进行重新整理汇总,方便大家查询与应用。敬请阅读。
2016年11月30日下午,中国社会科学调查中心十周年庆典暨国家自然科学基金-北京大学管理科学数据中心成果发布会在英杰交流中心月光厅隆重举行。
2005年,经过与北京大学社会科学相关院系专家、负责人以及国外知名教授充分酝酿和讨论,学校决定利用985经费的支持,建立“中国社会科学调查中心”,2006年8月29日,北京大学中国社会科学调查中心正式成立。这采用当前世界上最先进的调查方法和技术,在中国实施社会跟踪调查的。而开展的“中国家庭追踪调查(CFPS)”,是中国第一个学术性社会跟踪调查项目,将带动实证社会科学的研究。
目前北大调查中心设计并实施的CFPS项目和CHARLS项目,在设计理念和数据质量上都具有国际水平,项目数据对于深刻了解和研究变迁中的中国具有重大意义,随着追踪数据的积累,将会对学术研究和政策研究产生更深远的影响。
经过10年的不懈奋斗,调查中心已发展成为国内一流、国际存在竞争力的社会科学调查机构,建立了对学术界和政府机构免费开放的科学数据平台,为社会科学领域相关学科的研究提供了高质量数据服务,为以数据为基础的学术研究和政策研究提供了科学支撑。调查中心在队伍建设、调查方法与技术、数据服务与管理以及研究平台建设等方面取得的进展与成就。
北大开展和实施中国家庭跟踪调查项目引起了国内高校的争相效仿,国内高校陆续成立了类似的调查机构,涉及和开展各自的调查项目。这些调查机构都通过各自的渠道向社会政府等部门争取资源,寻求帮助,由于竞争格局的压力,也迫使各个调查机构在调查技术和方法上逐步的提升。一系列旨在开展系统性社会调查来手机各类数据的调查机构在国内的兴起,建立了中国社区、家庭、个人层面的微观数据库,分别有北大中国社会科学调查中心,中山大学社会科学调查中心、中国人民大学中国调查与数据中心、清华大学中国经济社会数据中心、上海大学上海科学调查中心、西南财经大学中国家庭金融调查与研究中心、复旦大学社会科学数据研究中心、中国社科院调查与数据信息中心等。
北京大学中国社会科学调查中心(Institute of Social Science Survey, ISSS)成立于2006年9月,是北京大学社会科学的数据调查平台,也是北京大学开展中国社会问题实证研究的跨学科平台。中心目前承担两个大型社会调查项目——中国家庭动态跟踪调查和中国健康养老追踪调查。两个项目的目的均是收集反映我国民生状况的高质量微观数据,用以分析社会民生方面的问题,为政策制定提供相关依据,同时推动社会、经济、教育等跨学科研究工作。
“中国家庭追踪调查“(CFPS)着重关注中国居民的经济与非经济福利,以及包括经济活动、教育成果、家庭关系与家庭动态、人口迁移、健康等在内的诸多研究主题,是一项全国性、大规模、多学科的社会跟踪调查项目。CFPS样本覆盖25个省/市/自治区,目标样本规模为16000户,调查对象包含样本家户中的全部共同生活的亲属。CFPS在2008、2009两年在北京、上海、广东三地分别开展了初访与追访的测试调查,并于2010年正式开展访问。经2010年基线调查界定出来的所有基线共同生活的亲属及其今后的血缘/领养子女将作为CFPS的基因成员,成为永久追踪对象。
开放数据年份丨2008、2009(测试性调查,北京、上海、广东);2010(基线年以后每年一次跟踪调查。最新公开数据:CFPS2016(追访)调查数据。
分析单位与调查规模丨社区、家庭、个人(成人、少儿);基线户。CFPS调查问卷共有社区问卷、家庭问卷、成人问卷和少儿问卷四种主体问卷类型,并在此基础上持续不断的发展出针对不一样性质共同生活的亲属的长问卷、短问卷、代答问卷、电访问卷等多种问卷类型。
覆盖区域丨中国25个省市,2010年在全国(西藏、青海、新疆、宁夏、内蒙古、海南、香港、澳门、台湾不在其列)正式实施。
应用主题丨人口健康分析、劳动就业分析、消费储蓄分析、空间规划分析、质量管理
其中,村/居问卷的调查内容有:村/居基础设施概况、人口和劳动力资源概况、自身及旁边的环境、基层选举、财政收入与支出,以及日常消费品价格等。
家庭问卷的调查内容有:共同生活的亲属结构、日常生活基本设施、社会交往、住房、家庭经济、农业生产与销售等。
成人问卷的调查内容有:教育、婚姻、职业、日常生活、健康、养老、社会保障、社会交往、价值观、以及基准测试等。
少儿问卷的调查内容有:学业情况、日常生活、健康、职业期望、与父母关系、成长环境、社会交往、价值观、以及基准测试等。
2011年(基线调查);以后每两年追踪一次,调查结束1年后,数据对外界公开。2013年(追踪调查);2014年(“中国中老年生命历程调查”专项)。最新公开数据:2015年CHARLS全国追踪调查数据。
覆盖区域丨基线个村、居展开。浙江、甘肃两省(2008、2012),中国28个省市(2011、2013、2014)
分析单位与调查规模:家户、个人(45岁及以上);2015年全国追访时,其样本已覆盖总计1.24万户家庭中的2.3万名受访者。
主要调查项目:个人基础信息,家庭结构和经济支持,健康情况,体格测量,医疗服务利用和医疗保险,工作、退休和养老金、收入、消费、资产,以及社区基本情况等。
研究主题:人口老龄化问题、劳动经济学(婚姻、彩礼等)、社会保障、人口经济学、卫生经济学等。
分析单位与调查规模丨社区、家庭、劳动;调查对象为样本家庭户中的全部劳动力(年龄15至64岁的共同生活的亲属)。
中国综合社会调查(Chinese General Social Survey,CGSS)始于2003年,是我国最早的全国性、综合性、连续性学术调查项目。CGSS系统、全面地收集社会、社区、家庭、个人多个层次的数据,总结社会变迁的趋势,探讨具有重大科学和现实意义的议题,推动国内科学研究的开放与共享,为国际比较研究提供数据资料,充当多学科的经济与社会数据采集平台。目前,CGSS数据已成为研究中国社会最主要的数据来源,广泛地应用于科研、教学、政府决策之中。
2003-2008年是CGSS项目的第一期,共完成5次年度调查(2007年没有执行),生产出5套高质量的年度数据。除2004年的调查数据,剩下的年度数据都已在中国国家调查数据库(China National Survey Data Archive,CNSDA)的网站(上发布,到目前为止,用户可免费申请使用。
时间跨度:分两期,第一期:2003年—2008年2008年,每年一次;第二期:2010年—2019年,每两年一次。最新公开数据:CGSS2013。
核心问题丨中国社会变迁(文化、健康、家庭、劳动力、就业、消费、教育、心理、个性等)
应用主题丨人口健康分析、劳动就业分析、消费储蓄分析、空间规划分析社会流动、幸福感、社会信任、教育回报、宗教信仰、政治参与等。
开放数据年份丨2011年开始首轮调查,每两年进行一次追踪调查。目前可利用数据CHFS2011、CHFS2013、CHFS2015。
以CFPS2013为例,除追访2011年访问的8438户家庭、29000个个体外,样本做首次扩展,最终共计调查来自全国29个省市、自治区(新疆、西藏除外)262个县区的28241个家庭,93000个个体。
上海大学上海社会科学调查中心是一个为上海大学人文社会科学各学科教学和科研服务的公共学术机构,同时也是一个为上海和国家经济社会持续健康发展提供决策咨询的公共服务平台。
中国工业公司数据库的统计范围是中国大陆地区销售额500万元以上(2011 年起为2000万元以上)的工业企业,即包括国有企业、集体企业、股份合作企业、联营企业、有限责任公 司、股份有限公司、私营企业、其他内资企业、港澳台商投资企业 、外商投资企业。统计变量包括企业 基本情况、企业财务情况、企业生产销售情况。工业的统计口径包括“采掘业”、“制造业”、“电力燃气及水的生产与供应业”三个门类,含盖中国工业制造业40多个大产业,90多个中类、600多个子行业。
主要指标: 企业的基本情况:法人代码、企业名称、法人代表、联系电话、邮政编码、具体地址、所属行业、注册类型、隶属关系、开业年份和职工人数等指标。 企业的财务数据:流通资产、应收账款、长期投资、固定投资、累计折旧、无形资产、流动负债、长期负债、实收资本、主营业务收入、主营业务成本、营业费用、管理费用、财务费用、营业利润、利税总额、广告费、研究开发费、工资总额、福利费总额、增值税、工业中间投入、工业总产值和出货值等指标。
核心问题:全国最为详细、所用最为广泛的微观数据库,主要研究工业企业的相关问题。
特点:中国工业企业数据库的特点是,统计指标比较多,统计范围比较全,分类目录比较细,准确程度要求高。由各省、自治区、直辖市统计局和国务院各有关部门报送给国家统计局。
具体内容:数据内容中的工业统计指标包括工业增加值、工业总产值、工业销售产值等主要技术经济指标以及主要财务成本指标和从业人员、工资总额等。
海关数据就是海关履行进出口贸易统计职能中产生的各项进出口统计数据。海关统计的任务是对进出口货物进行统计调查、统计分析和统计监督,进行进出口监测预警,编制、管理和公布海关统计资料,提供统计服务。数据具体到各企业、各海关口岸的商品具体进出口情况。主要指标:海关数据库主要指标有HS编码、商品名称、金额、数量、单价、产销国、海关口岸、贸易方式、运输方式、中转国、企业编码、企业名称、企业性质、收发货地等等。
核心问题:主要是海关履行进出口贸易统计职能中产生的各项进出口统计数据,专注企业进出口情况。
主要指标:海关数据库主要指标有HS编码、商品名称、金额、数量、单价、产销国、海关口岸、贸易方式、运输方式、中转国、企业编码、企业名称、企业性质、收发货地等等。
抽样方式:在全国范围内按一定比例(0.05%左右,每次的比例略有差别)进行多阶段抽样。
覆盖省份:针对中国大陆31个省、自治区、直辖市203万户私营企业和企业主
核心问题:针对私营企业和私营企业主的综合状况进行调查,内容详细,关注和研究我国私营企业发展。
具体内容:本调查是目前国内关于私营企业的全国性调查中对于私营企业主个人特征,尤其是社会和政治特征的调查最为集中的一项,且运用全面、系统、翔实的调查数据,对私营经济与私营企业主阶层的成长过程做了记录。
代表文章:政治资本、人力资本与行政垄断行业进入——基于中国私营企业调查的实证研究[J].中国工业经济,2012年09期
抽样方式:主要针对一些国家的非农企业进行抽样调查,调査样本根据企业注册域名采用分层随机抽样的方法获取。
具体内容:以2012年的数据为例,调査涉及企业位于大连、北京、石家庄、郑州、深圳、成都等25个城市,涵盖中国东、中、西三大区域; 调查对象为企业总经理、人力资源经理、会计师或者其他职员。调查涉及食品制造业、纺织业、服装业、基本金属制造业、电子工业、交通设备制造业等2 0 多个行业;调查内容包括公司基本信息、城市基础设施和公共服务、销售和供货、市场竞争程度、用地和行政许可、创新和技术、融资、政商关系、用工、商业环境及企业绩效等多个方面。
代表文章:吕铁,王海成,劳动力市场管制对企业技术创新的影响——基于世界银行中国企业调查数据的分析[J].中国人口科学,2015年04期
具体内容:该系统收录了中国自1985年实施专利制度以来的全部中国专利数据,具有较高的权威性,网上数据每周更新一次,是国内最好的专利数据库检索系统之一。
代表文章:庄涛,吴洪,基于专利数据的我国官产学研三螺旋测度研究——兼论政府在产学研合作中的作用[J].管理世界,2013年08期
覆盖省份:目前有调查农户23000户,调查村360个行政村,样本分布在全国除港澳台外的31个省(区、市)。
核心问题:通过观察点对农村社会经济进行长期的连续调查,掌握生产力、生产关系和上层建筑领域的变化,了解不同村庄和农户的动态、要求,从而取得系统周密的资料。
具体内容:其主要工作是:一是常规调查:每年底按统一口径全面收集所有样本村、户数据;二是专题调查:根据上级领导的指示及有关部门的安排,针对农村发展、农业生产和农户生产生活中的焦点、重点问题,每年开展多项专题调查;三是动态反映:省、县两级调查机构及时反映当地农村中出现的新情况和新问题;
代表文章:林本喜,邓衡山,农业劳动力老龄化对土地利用效率影响的实证分析——基于浙江省农村固定观察点数据[J].中国农村经济,2012年04期
代表文章:赵西亮,梁文泉,李实. 房价上涨能够解释中国城镇居民高储蓄率吗?——基于CHIP微观数据的实证分析[J]. 经济学(季刊),2014,01:81-102.
覆盖省份:本项目主要在人口流出或流入的大省做出详细的调查。其中,农村住户调查是在以下9个省(直辖市)进行:安徽,重庆,广东,河北,河南,湖北,江苏,四川,浙江;城市流动人口调查是在以下15个城市进行:蚌埠,成都,重庆,东莞,广州,合肥,杭州,洛阳,南京,宁波,上海,深圳,武汉,无锡,郑州。城镇住户调查是在19个城市进行,包括城市流动人口调查以外的四个城市:安阳市,建德市,乐山,绵阳。
具体内容:调查问卷涉及个人和家庭层面的信息如家庭构成、成人教育、成人就业、家庭资产等。
代表文章:温兴祥. 城镇化进程中外来居民和本地居民的收入差距问题[J]. 人口研究,2014,02:61-70.
覆盖省份:现在大家使用的是六个省份的数据(北京、广东、浙江、辽宁、陕西、四川)。每年大约有3500-4000户的数据。
核心问题:这是现有的最全的全国范围的微观变量数据,主要研究教育回报率、收入不平等、家庭消费、家庭金融等问题。
具体内容:调查主要包含个人和家庭层次的变量。如与户主关系,性别、年龄、家庭总收入、家庭消费等。
代表文章:谢洁玉,吴斌珍,李宏彬,郑思齐. 中国城市房价与居民消费[J].金融研究,2012,06:13-27.
覆盖省份:CLHLS基线调查和跟踪调查涵盖了中国31个省中的23个。涵盖区域总人口在1998年基线亿,大约占全国总人数的85%。我们在22个调研省份(不包括海南省)中随机选择大约一半的市/县作为调研点做出详细的调查。 分
核心问题:本项目的研究目标旨在更好地理解影响人类健康长寿的社会、行为、环境与生物学因素,为科学研究、 老龄工作与卫生健康政策信息依据填补空白。
具体内容:主要搜集老人死亡年月、死因、死前健康与生活自理能力等信息。在2008年调查中,我们还从大约14,000位年龄在40-110岁的自愿受访者中收集了唾液DNA样本,在2009年和2012年的8个健康长寿典型调研地区的调研中,我们采集了约4800位被访者的血液和尿样样本。另外,在1998年的基线+岁高龄老人的指尖血样样本。
代表文章:顾和军,刘云平. 教育和培训对中国城镇劳动力就业的影响——基于CLHLS数据的经验研究[J]. 人口与经济,2013年01期. 网站链接:
时间跨度:1990 年、2000年全国人口普查数据和2005年全国1%人口抽样调査数据。
分析单位与调查规模:家庭、个人;1999年和2000年数据为全国人口的1%随机子样本,2005年数据是全国1%人口抽样调查数据的随机再抽样,占全国总人口的0.2%。
主要调查项目:个人层次变量:人口学特征、就业、教育、迁移等。家庭层次变量:家庭特征、住房、生育、生活条件等。
研究主题:计划生育效果、劳动力迁移、人口老龄化、留守老人与儿童、房地产价格等。
分析单位与调查规模:学校、班级、学生、家长;以初中一年级(7年级)和初中三年级(9年级)两个同期群为调查起点,以学校为基础,在入选的县级单位随机抽取了112所学校、438个班级做出详细的调查,被抽中班级的学生全体入样,基线万名学生。
研究主题:旨在揭示家庭、学校、社区以及宏观社会结构对于个人教育产出的影响,并进一步探究教育产出在个人生命历程中发生作用的过程。
调查区域:全国31个省、市、自治区范围内的243个县、市、区的4382家宗教活动场。
调查对象:包括各县、市、区的宗教主管部门的负责人和各宗教活动场所的负责人。
研究主题:旨在记录并解释中国宗教的现状与变迁,全面收集中国宗教不一样的层次的基础数据,综合反映中国社会转型时期的宗教发展状况。
(中国家庭收入项目)是中国社会科学院经济研究所收入分配课题组(李实、赵人伟老师主持,福特基金赞助)于1988年、1995年和2002年,进行的全国调查中的中国农村和城市居民家庭收入分配调查得到的。1995年的调查覆盖19个省(市、自治区),调查了6931户城镇家庭和7998户农村家庭,分别涉及21696位城镇居民和34739位农村居民;2002年的调查覆盖22个省(市、自治区),调查了6835户城镇家庭和9200户农村家庭,分别涉及20632位城镇居民和37969位农村居民。