SAS® Model Studio apresenta pesquisa

 

conceito básico

SAS Viya incluído no Model Studio é um ambiente de visualização integrada, que fornece um conjunto de ferramentas de mineração de dados analíticos para facilitar fim a análise final dos dados de mineração. ferramentas de data mining apoio estúdio modelo são projetadas para tirar proveito de ambiente de processamento de programação e nuvem SAS Viya para fornecer e distribuir campeão modelo, código de pontuação e resultados.

Model Studio fornece uma visão funcional do seguinte:

Aplicação do modelo criado em Model Studio em como se segue:

SAS Model Studio inclui as seguintes três soluções:

  •                     SAS Forecasting Visual
  •                    SAS Visual Data Mining e Machine Learning
  •                    SAS Visual Text Analytics

Documentos relacionados: http://documentation.sas.com/?cdcId=capcdc&cdcVersion=8.3&docsetId=capov&docsetTarget=titlepage.htm&locale=zh-CN

ambiente no XXX SAS fornece SAS Visual Data Mining e só Aprendizado de Máquina.

construção de modelos

Em Modelo Studio, os nós do gasoduto, o gasoduto é semelhante ao fluxo de trabalho, os dados eo nó pode ser composto de uma lógica de execução ordenada. Uma conduta pode incluir uma pluralidade de modelos do modelo pode ser seleccionado dentro de uma conduta de modelo vencedor, também podem ser comparados entre todos os diferentes modelos do tubo, a título modelo seleccionado.

Um tubo que é como se segue, e que tem nós de dados.

1 dados

Apenas uma tabela de dados em um projeto, e o nó "dados" é necessária nó, que é o ponto de partida para qualquer pipeline. Ele fornece as informações de metadados sobre as fontes pipeline de projetos e dados variáveis ​​relacionadas.

dados referenciados é automaticamente adicionada à tubagem. Os dados podem ser substituídos.

O utilizador deve especificar o papel de cada coluna de dados, podem ser utilizados personagem como mostrado abaixo:

Não.

Nome da função

1

residual

2

seção

3

classificação

4

divisória

5

filtro

6

vínculo

7

objetivo

8

compensar

9

avaliar

10

tempo ID

11

entrada

12

rejeitado

13

previsão

14

EU IRIA

nó 2

Similar ao módulo de análise, em projectos de mineração de dados e Máquina aprendizagem visual SAS, o nó pode ser usado como mostrado abaixo:

tipo

explicação

Data Mining O pré-tratamento

Cluster variável

Executar clustering para reduzir o número de variáveis ​​de entrada.

seleção de variáveis

Executar métodos não supervisionados e algum descuido na escolha de métodos para reduzir o número de variáveis ​​de entrada.

Preencher uma vaga

O método como valores em falta especificados e entradas do tipo secção de classificação cheios.

variáveis ​​de gestão

Modificar variáveis ​​de metadados.

filtração

Observação excluídos da análise com base nos critérios especificados.

Clustering

Clustering é realizada com base em observações ao segmento de dados.

Feature Extraction

Características como entrada gerada com base na APC, APC estável, codificador SVD ou automática. PCA, SVD e PRCA única entrada intervalo.

substituir

Alternativamente valores tais como outliers e outros valores de dados de nível de classificação desconhecida com o valor especificado.

text Mining

Analisar e executar temas encontrados dados de texto em preparação para a modelagem.

detecção de anomalias

Suporte de dados Descrição vector utilizado para identificar e remover os outliers (observada).

mudança

variáveis ​​de entrada do conversor numéricos ou conversão Bin.

aprendizagem supervisionada

regressão quantílica

modelo de regressão Quantile foi equipado objetivo Interval.

(Sistema baseado em modelo irá adicionar automaticamente o operador de operador de comparação de modelos)

Árvore de decisão

Montagem árvore de classificação ou um conjunto de árvores de classificação alvo e de regressão como objetivo Interval.

_1 árvore

modelo de regressão Quantile foi equipado objetivo Interval.

lote Código

SAS para executar o código do lote.

Avaliação Importação de Código

código de importação SAS pontuação.

floresta

Floresta modelo de encaixe, o qual compreende uma pluralidade de dados com base em diferentes amostras e diferentes subconjunto da árvore de decisão de entrada.

Redes neurais

Montagem completa interconexão modelo de rede neural.

atualização gradient

Fitting modelo promoção gradiente, para gerar uma série de sucessivos árvore de decisão.

Regressão linear

Ordinary modelo de regressão de mínimos quadrados foi montado objetivo Interval.

Rede de Bayesian

Montagem modelo de rede Bayesiana para classificar o alvo.

GLM

secção linear generalizado modelo apropriado tendo um certo tipo de direccionamento e funções de gestão, respectivamente.

regressão logística

-Tipo binário nome da coluna ou tipo de destino caber modelo de regressão logística.

SVM

O método de ponto interior para optimizar certas tipo de montagem support vector machines binários.

Após tratamento

integrado

Usando a probabilidade posterior de vários modelos (para alvos categóricas) ou valor preditivo (por objetivo Intervalo) para criar um novo modelo.

diverso

Salvar dados

Salvar Nó exportados por gasoduto para a biblioteca lógica CAS.

Open Source

运行Python或R代码。该代码不在CAS中执行,会创建并下载数据样本(默认10,000个观测)已避免移动大量数据。

数据探索

显示数据表中变量的汇总统计量和图。该节点选择变量子集来创建数据具有代表性的快照。可以选择变量来显示最重要的输入或指出具有异常统计量的“可疑变量”

SAS代码

运行SAS代码。允许将SAS代码合并到Model Studio管道。

3管道

Model Studio项目可以包括一个或多个管道,而一个管道由一个数据集和多个节点组成。

一个管道中可以包括多个机器学习节点,从而通过一个管道即可训练得到多个机器学习模型。

                          Model Studio提供了管道模板。

4管道比较

管道比较可以在不同管道的模型之间进行比较,从而选出冠军模型。只有运行完的管道才可以参与比较。

在管道比较页面,除可以查看参与比较的模型外,也可以查看冠军模型的多项统计指标。

 

5注册模型

在管道中训练得到的模型需要“注册”后才可以被管理,即模型注册后,可以在“模型管理器”中管理模型。模型管理器是进行存储和管理模型的公共仓库,它可以用于模型治理和模型修改控制。

注册操作不需要配置,仅是一个“动作”。

6发布模型

模型发布后才可以在各种运行时引擎中执行。模型发布时需要指定发布目标,发布目标包括三种类型:CAS、Hadoop以及Teradata,发布目标需要先配置再使用(可以在SAS® Environment Manager中创建发布目标,可以参考http://documentation.sas.com/?docsetId=calpubdest&docsetTarget=p02scrqf37kexwn1gi60khpshifz.htm&docsetVersion=3.4&locale=zh-CN&showBanner=walkup)。

7下载评分API

在Model Studio中可以下载模型的评分API,如下所示

类型

下载文件类型

Python

.py

REST

.txt

SAS

.sas

并且在下载界面提供了各类型API的示例

8下载评分代码

下载的评分代码为包含.sas程序的zip压缩包。评分代码包含了监督学习节点以及其前面的数据挖掘预处理节点。

下载得到的模型可以在Model Manager中进行导入。

在Model Manager中进行模型的评分、发布测试必须要有评分代码。

9评分预留数据

使用训练得到的模型对预留数据进行评分。

发布了227 篇原创文章 · 获赞 94 · 访问量 54万+

Acho que você gosta

Origin blog.csdn.net/wiborgite/article/details/90046323
Recomendado
Clasificación