Kaggle：San Francisco Crime Classification - 代码天地

Kaggle：San Francisco Crime Classification

其他 2018-06-08 05:08:43 阅读次数: 3

比赛地址
这里用logistic regression来完成这个预测问题。

def read_data(file_name):
    f = open(file_name)
    #ignore header
    f.readline()
    samples = []
    target = []
    for line in f:
        line = line.strip().split(",")
        sample = [float(x) for x in line]
        samples.append(sample)
    return samples

def write_delimited_file(file_path, data,header=None, delimiter=","):
    f_out = open(file_path,"w")
    if header is not None:
        f_out.write(delimiter.join(header) + "\n")
    for line in data:
        if isinstance(line, str):
            f_out.write(line + "\n")
        else:
            f_out.write(delimiter.join(line) + "\n")
    f_out.close()
from sklearn.linear_model import LogisticRegression
import csv_io
import math
import scipy

def train_and_predict():
    #read in the training file
    train = read_data("train.csv")
    print('读取训练数据完毕\n...\n')
    #set the training responses
    target = [x[0] for x in train]
    #set the training features
    train = [x[1:] for x in train]
    #read in the test file
    realtest = read_data("test.csv")
    print('读取待预测数据\n...\n')

    # code for logistic regression
    lr = LogisticRegression()
    lr.fit(train, target)
    print 'Logistic Regression训练完毕!\n...\n'
    predicted_probs = lr.predict_proba(realtest)

    # write solutions to file
    predicted_probs = ["%f" % x[1] for x in predicted_probs]
    write_delimited_file("lr_solution.csv", predicted_probs)

    print('Logistic Regression预测完毕! 请提交lr_solution.csv文件到Kaggle')

if __name__=="__main__":
    train_and_predict()

转自 https://blog.csdn.net/han_xiaoyang

猜你喜欢

转载自blog.csdn.net/douhh_sisy/article/details/80610546

Kaggle：San Francisco Crime Classification

Bridge of San Francisco

crime

[Kaggle]Plant Seedlings Classification

初尝Kaggle系列—Leaf Classification(keras)

Kaggle实战之leaf classification（树叶分类）

kaggle: Plant Seedlings Classification 植物幼苗分类

Classification

Kaggle-Quora Insincere Questions Classification-Solution

我在<Kaggle> <Flower Classification with TPUs>中的解决方案

[Kaggle] Spam/Ham Email Classification 垃圾邮件分类（spacy）

【Kaggle微课程】Natural Language Processing - 2.Text Classification

D. Mysterious Crime

Francisco Partners收购Comodo CA业务

kaggle的toxic_comment_classification比赛21th经验总结

Machine Learning Homework 3 - Image Sentiment Classification Kaggle题解报告（基于pytorch架构）

【第一次参加kaggle比赛记录-Quora Insincere Questions Classification】- Word Embedding

Kaggle比赛Flower Classification with TPUs中配置TPU以及加载公开数据集的问题

深度学习图像分类：Kaggle植物幼苗分类（Plant Seedlings Classification）完整代码

Kaggle: Jigsaw Multilingual Toxic Comment Classification Top Solutions 金牌思路总结

State Street任命Francisco Aristeguieta领导其国际业务

Crime Management Codeforces107D

CF1043D Mysterious Crime

Codeforces Round #519 D - Mysterious Crime

[CF107D]Crime Management

CF1043D - Mysterious Crime

codeforces 1043 D. Mysterious Crime

挑战练习13.6 删除crime 记录

挑战练习14.8 删除crime 记录

D. Mysterious Crime(枚举暴力,思维)

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)