大数据统计地市级党委书记数据库2000-2010的数据

大数据统计地市级党委书记数据库2000-2010的数据

数据见文末下载!

声明:该数据库并非楼主本人,所有权属复旦大学经济学院陈硕副教授及团队,帖子仅仅是数据分享,希望大家在使用过程中,仔细按照官方数据库说明进行。
以下是数据建立方法:
1. 查阅各省(及自治区)年鉴整理出 2000-2010 年间各地市级行政区划党委书记名单
2. 通过人民网、新华网、各地方ZF网站及百度百科查询各党委书记简历
3. 对简历进行电子化整理获得现有数据库
4. 当某市某年有超过 1 位党委书记任职时,我们以最后上任书记信息为准

陈硕,2015,从治理到制度:央地关系下的中国政治精英选拔,1368-2010。复旦大学经济系工作论文

这里我们根据这个xls文件得出01.xlsx,然后再整理得出01.txt文件,再进行分析得出如下图:
这里写图片描述

这里写图片描述

数据挖掘步骤大概分为以下:1、数据采集2、数据清洗3、数据分析4、显示数据

//1、将xls文件转为txt文件
我们获得的xls数据先转为txt文件,方便操作

String filePath = "C:\\Users\\admin\\Desktop\\01.xlsx";
String filePath2 = "C:\\Users\\admin\\Desktop\\01.txt";
String data = _excelUtils.readFile(filePath);
_txtUtils.writeTxtFile(filePath2, data);

//2、数据清洗

        int[] len = {12,1};
        String result = _txtUtils.getBigDataTxt(filePath2, len);
        List<Map<String,Object>> list = new ArrayList<Map<String,Object>>();
        List<Map<String,Object>> totalList = new ArrayList<Map<String,Object>>();
        Map<String,Object> map = null;
        Map<String,Object> map2 = null;
        String[] results = result.split(",");
        for(String str : results){
            String[] strs = str.split("-");
            map = new HashMap<String,Object>();
            map2 = new HashMap<String,Object>();
            map2.put("province", strs[1]);
            totalList.add(map2);
            map.put("province", strs[1]);
            map.put("sex", strs[0]);
            list.add(map);
        }
        totalList = _listUtils.getNoList(totalList);  //去除重复
        List<Person> list2 = getListInArray(totalList,list);
        _listUtils.sort(list2, false, "fmaleCount");
        for(Person str : list2){
            System.out.print(str.getFmaleCount()+", ");
        }

//3、数据统计分析

//      Integer male = _listUtils.getNumInArray("男", results);
//      Integer fmale = _listUtils.getNumInArray("女", results);
//      Integer total = results.length;
//      String malePer = _stringUtils.getNumberPercent(male+"", total+"");
//      String fmalePer = _stringUtils.getNumberPercent(fmale+"", total+"");
//      
//      System.out.println("总样本量:"+total+"\r\n"
//              + "男性样本量:"+male+" \r\n"
//              + "女性样本量:"+fmale+"\r\n"
//              + "男性比例:"+malePer+"\r\n"
//              + "女性比例:"+fmalePer+"\r\n"
//              + "");

//4、制作成图表

<script type="text/javascript">
var dom = document.getElementById("container");
var myChart = echarts.init(dom);
var app = {};
option = null;
app.title = '环形图';

option = {
    tooltip: {
        trigger: 'item',
        formatter: "{a} <br/>{b}: {c} ({d}%)"
    },
    legend: {
        orient: 'vertical',
        x: 'left',
        data:['男','女']
    },
    series: [
        {
            name:'男女占比',
            type:'pie',
            radius: ['50%', '70%'],
            avoidLabelOverlap: false,
            label: {
                normal: {
                    show: false,
                    position: 'center'
                },
                emphasis: {
                    show: true,
                    textStyle: {
                        fontSize: '30',
                        fontWeight: 'bold'
                    }
                }
            },
            labelLine: {
                normal: {
                    show: false
                }
            },
            data:[
                {value:2633, name:'男'},
                {value:75, name:'女'}
            ]
        }
    ]
};
;
if (option && typeof option === "object") {
    myChart.setOption(option, true);
}
       </script>

需要源码学习,下载地址:http://47.98.237.162/detail/1/173

猜你喜欢

转载自blog.csdn.net/sinat_15153911/article/details/81808057