解析企业对外直接投资(三种数据+模糊匹配解决方案)

我国已经是世界第一贸易大国,同时,在全球对外直接投资领域也扮演着越来越重要的角色。根据商务部公布的《2015 年度中国对外直接投资统计公报》,2015 年我国对外直接投资流量为 1456.7 亿美元,首次位列全部国家(地区)的第二位;对外直接投资存量为 10978.6 亿美元,位列全球第 8 位,投资遍布全球 188个国家(地区);与此同时,我国对外投资额首次超越吸引外资额,开始步入资本净输出阶段。


现有文献研究中国企业的对外直接投资问题主要使用以下三种数据:


一、中国上市企业对外直接投资


我们从上市企业年报中收集整理了2007-2019年A股上市企业的ODFI数据


具体指标包括:证券代码    统计截止日期    货币编码    货币类型    投资事件类型    报告期末投资金额总计 占报告期对外投资总额的比例(%)


具体请见附件一





二、商务部公布的《境外投资企业(机构)名录》数据


该数据不仅包括上市企业的ofdi相关数据,还包括规模以上工业企业的OFDI数据


我们收集整理了1980-2014年《境外投资企业(机构)名录》数据


具体请见附件二


此外,关于工业企业的ofdi问题


学者一般使用企业名称将中国工业企业数据库与《境外投资企业(机构)名录》数据进行匹配后进行实证研究


但是,由于两个数据库的企业名称存在较大差别,模糊匹配会严重损失样本


因此,我们提供了一种模糊匹配的解决方案


三、模糊匹配


该方法参考余淼杰 智琨 田巍的研究


具体的合并方法包含以下三个步骤。


首先,我们根据企业的中文名称和年份进行合并。如果特定年份企业的中文名称在两套数据库中完全相同,则被认为是同一家企业,该企业被标记为进行了对外直接投资的企业。然而,由于一些企业在两套数据库的中文名称不完全相同,上述做法会漏掉一些企业。如一家企业在《境外投资企业(机构)名录》名为“云南泰兴矿业有限公司”,我们将其分解为四个字符串,其中地区字符串
为“云南”,行业字符串为“矿业”,企业类型字符串为“有限公司”,特定名称字符串为“泰兴”。


考虑到这部分企业在两套数据库的中文名称可能会有相同的部分,我们第二步的工作是将企业名称进行分解,分别提取指代其所在地区、行业、企业类型、特定名称的字符串。如果企业的这些特定字符串在两套数据库中完全相同,则被认为是同一家企业。最后,为进一步降低匹配误差,我们对第二步匹配成功的企业进行了手动检查。


根据上述方法,我们提供了解决该问题的方法、代码(stata dofile)


由于工企数据库较大,我们仅摘取部分数据进行演示说明


具体请见附件三


四、由美国企业研究所和传统基金会编制的OFDI数据


时间:2005-2022年


具体请见附件四


附件五为上述所有数据的合集


非诚勿扰

下载链接:https://bbs.pinggu.org/thread-11385532-1-1.html
 

猜你喜欢

转载自blog.csdn.net/kawhi_li2019/article/details/129951327