인터넷 전체에서 가장 포괄적인 지식지도 설명!

지식 그래프란 무엇인가

지식 그래프 표준화 백서 정의: 지식 그래프는 객관적 세계의 개념, 개체 및 그 관계를 구조화된 형태로 설명하고, 인터넷 정보를 인간의 인지 세계에 더 가까운 형태로 표현하며, 더 나은 방법을 제공합니다. 인터넷상의 방대한 정보를 이해합니다.

간단히 말해서, 지식 그래프는 노드(점)와 엣지(에지)로 구성됩니다. 각 노드는 개체를 나타냅니다. 개체는 객관적 세계의 사람, 사물, 사물을 나타낼 수 있습니다. 각 가장자리는 관계를 나타내며, 관계는 표현될 수 있습니다. 서로 다른 엔터티 사이의 연결. 본질적으로 지식 그래프는 그래프 구조에 저장된 의미 네트워크로 이해될 수 있습니다.

여기에 이미지 설명을 삽입하세요.

지식그래프 탄생 배경

지식 그래프는 1950년대에 탄생했으며, 그 발전은 크게 3단계로 나눌 수 있다. 첫 번째 단계(1950~1977)는 지식 그래프의 계몽기로서, 이 시기에는 문서 색인의 상징적 논리가 제안되어 점차 현대 과학의 발전을 연구하는 일반적인 방법이 되었다. 두 번째 단계(1977~2012)는 지식 그래프의 성장기로서 의미론적 네트워크가 급속히 발전하여 지식 온톨로지에 대한 연구가 컴퓨터 과학의 중요한 분야로 자리잡았다. , 하우넷이 등장했고, 대규모 인공지식베이스를 통해 컴퓨터 간, 컴퓨터와 사람 간 지식 교환이 더욱 쉬워졌습니다. 세 번째 단계(2012~현재)는 지식그래프 전성기로서, 2012년에는 구글이 주도적으로 지식그래프(KG) 개념을 제안하였고, 구글은 지식그래프 기술을 통해 검색엔진 성능을 향상시키고 사용자 검색 경험을 향상시켰다. 현대 지식 그래프의 한 장을 열었습니다.

현재 빅데이터 시대의 도래와 함께 데이터의 양은 기하급수적으로 증가하고 있으며, 지식 그래프 역시 학계에서 현대 기업에 적합한 일반화된 대규모 지식 그래프로 변모하고 있다. 인공지능 기술의 활발한 발전으로 기본 그래프 데이터베이스 저장, 컴퓨팅 파워의 대규모 배치 등 지식 그래프의 주요 기술적 어려움이 어느 정도 해결되었습니다. 검색 엔진 분야 외에도 지식 그래프 기술은 전자상거래, 의료, 금융, 에너지 및 기타 분야에서 뜨거운 기술이 되어 업계 생산 링크의 핵심 문제점을 해결하고 있습니다.

지식 그래프 표현

위에서 언급한 바와 같이 지식 그래프의 본질은 노드가 개체를 나타내고 엣지가 개체 간의 의미 관계를 나타내는 의미 네트워크이며, 기본 논리 구조는 패턴 계층과 데이터 계층으로 구분됩니다. 패턴 레이어는 데이터 레이어 위에 위치하며 지식 그래프의 핵심으로, 엔터티, 관계, 속성 및 기타 계층 구조를 포함하여 정제된 지식 데이터 모델을 저장합니다. 데이터 레이어는 주로 사실 데이터 정보, 즉 현실 세계의 실제 정보로 구성되며, 일반적으로 "개체-관계-개체" 또는 "개체-속성-속성 값" 트리플을 기본 표현으로 사용합니다.

현재 지식 그래프를 표현하기 위한 대표적인 그래프 데이터 모델로는 RDF 그래프와 속성 그래프가 있는데, 두 모델의 표현 방식과 차이점, 한계점에 대해 설명하면 다음과 같다.

RDF의 전체 이름은 Resource Description Framework이며 원래 Semantic Web의 맥락에서 설계되었으며 주어-술어-객체 트리플 형태로 자원을 설명하는 데이터 모델입니다. 아래 그림은 RDF의 예입니다. 도표. RDF 그래프 모델을 사용하여 지식 그래프를 표현하려면 먼저 데이터 사전을 구축하고 데이터 모델링을 위한 메타데이터 항목을 정의해야 합니다. {메타데이터 항목에는 주로 클래스와 속성의 두 가지 유형이 포함되며, 클래스는 객체 인스턴스의 모음을 참조하고, 속성은 두 가지 하위 유형으로 구분됩니다. 하나는 클래스의 속성을 나타내고 다른 하나는 여러 클래스 간의 관계를 나타냅니다. 예를 들어, RDF를 사용하여 책을 설명하려면 RDF 데이터 사전에서 책에 포함된 저자, 책 제목, 페이지 수, 출판 시간, 언어 유형 등을 정의해야 합니다. 정의가 완료된 후 특정 책은 데이터가 매핑됩니다. 따라서 RDF 데이터 사전의 정의 자체가 RDF 그래프 스키마이며, 완전한 스키마를 통해 사용자는 실제 지식을 그래프에 매핑하는 것이 편리합니다.
여기에 이미지 설명을 삽입하세요.

속성 그래프에서 정점은 엔터티를 나타내고 엣지는 엔터티 간의 관계를 나타냅니다. 속성은 키-값 쌍의 역할을 합니다. 정점과 엣지 모두 속성을 지원합니다. 다음 그림은 속성 그래프의 예입니다. 표현 내용은 속성 그래프의 예와 일치합니다. 위의 RDF 그래프는 캐릭터 '오정'과 영화 '창진호'를 정점으로 하고, 주연 영화를 엣지로 사용했으며, 캐릭터 정점은 속성 "성별"과 "나이" 정보를 가지며, 영화 정점에는 "출시 시간" 및 "흥행" 정보 속성이 있습니다. 지식 그래프를 표현하기 위해 속성 그래프 모델을 사용하는 경우 먼저 그래프 모델을 구축하고 그래프 모델의 점-에지 구조와 속성 정보를 정의한 후 데이터를 매핑해야 합니다. 비즈니스 담당자가 수요 변화에 따라 그래프 모델을 조정해야 하는 경우 그래프 모델 구조를 다시 작성하지 않고 가장자리와 속성만 조정할 수 있습니다.

여기에 이미지 설명을 삽입하세요.
학문 분야에서는 고정된 구조의 정적 데이터를 저장하고 표준화된 인터페이스를 제공하는 경우가 많으며, RDF 스키마를 재사용하여 데이터의 공개 공유를 달성하고 직원의 작업 중복을 피할 수 있습니다. 그러나 다른 산업 분야에서는 RDF 그래프에는 재사용 가능한 데이터 사전이 없기 때문에 새로운 RDF 데이터 세트를 개발하는 데 비용이 많이 들고 RDF의 꼭지점에 대한 레이블이나 유형의 개념이 없다는 한계가 있습니다. through another 주제, 술어, 객체로 완성 비즈니스에서 속성을 추가해야 할 경우 RDF 그래프에 속성을 추가하기 위해 Edge 구조를 수정해야 함 그래프 모델이 변경되어 이전 쿼리 문을 쉽게 사용할 수 없게 될 수 있음 그러나 속성 그래프의 경우 그래프 모델에서는 비즈니스의 정상적인 사용에 영향을 주지 않고 직접 수정이 가능합니다. 예를 들어, 주연을 맡은 영화 측면에 "role" 속성을 추가해야 하는 경우 아래 그림과 같이 속성 맵 측면에 직접 속성을 추가하면 됩니다.
여기에 이미지 설명을 삽입하세요.
RDF 그래프는 간선에 대한 속성 설정을 지원하지 않으므로 동일한 유형의 간선은 동일하며 간선은 반복적으로 사용됩니다. 단순히 "영화 출연" 옆에 "오경"과 "장진호"의 역할 관계를 추가하면 모든 "영화 출연" 술어에 동일한 속성이 추가됩니다. RDF에서는 아래 그림과 같이 문장을 표현하기 위해 새로운 정점 "ex:xxx"를 생성하는 것이 일반적인 방법이다.

여기에 이미지 설명을 삽입하세요.
RDF 그래프에 속성을 추가하면 원래의 그래프 모델 구조가 변경되는 것을 볼 수 있는데, 한 홉으로 완료할 수 있는 쿼리는 완료하려면 2개 이상의 홉이 필요합니다. 현재 산업 지식 그래프가 대규모 데이터 규모, 다중 실시간 변화, 복잡한 비즈니스 모델 방향으로 발전하고 있는 점을 고려할 때, RDF 그래프 모델로 구성된 지식 그래프는 개발 병목 현상에 직면하고 배포 후 운영 및 유지 비용이 높음 , 속성 그래프는 모델로 표현된 지식 그래프가 고객에게 점차 인식됩니다.

지식 그래프의 폭넓은 적용

위에서 언급했듯이 Google은 지식 그래프 기술을 사용하여 검색 엔진 성능을 최적화하고 사용자 검색 정확도를 크게 향상시킵니다. 또한, 대규모 지식 그래프 기술은 다양한 산업 분야에서 널리 활용되고 있습니다.

금융분야에서 지식그래프는 금융지식의 추출, 융합, 분석, 추론, 의사결정 등의 기능을 제공하며, 금융분야에서 고립된 멀티소스 데이터를 개방하는 데이터 추출, 정보추출 등의 기술을 통해 의미 명확성, 지식 융합 및 지식 처리, 신용 카드 사기 방지, 위험 예측, 지능형 마케팅 및 스마트 금융의 기타 애플리케이션을 실현하기 위한 금융 지식 그래프를 구축합니다. 예를 들어, 지식 그래프는 휴대전화번호, 연락처, IP 주소, 장비, 신청서류 등 주요 사기 요소를 기반으로 신용카드 사기방지 관계 그래프를 구축하며, 사기조직이 IP, 휴대전화번호, 장비 등을 공유할 수도 있다. 범죄 비용을 고려한 기타 정보 이러한 확립된 규칙을 기반으로 사기를 판단하고 잠재적인 사기 사용자를 식별하여 조기 경고를 제공합니다.

산업분야에서는 빅데이터 시대의 도래와 함께 전통적인 산업분야에서 점점 더 디지털 트랜스포메이션을 맞이하고 있습니다. 지식 그래프는 생산 과정에서 관련 매개 변수에 대한 심층 분석을 통해 제품 수율과 밀접한 관련이 있는 결정 요인을 계산하고, 영향 요인을 기반으로 결과의 곡선 모델을 구축하고 최적의 솔루션을 최종 생산에 적용합니다. . 또한 지식 그래프에는 공급망 최적화, 생산 프로세스 개선, 장비 고장률 감소 등 산업 현장의 적용 시나리오도 있습니다.

에너지 분야에서 현대 전력망은 물리적 전력망을 기반으로 첨단 센서 기술, 정보 기술, 데이터 분석 기술, 컴퓨터 제어 기술 등이 결합된 스마트 그리드입니다. 지역 전력 수요를 충족하고 전력 할당을 최적화하며 전력 공급의 유연성과 안정성을 보장하고 사용자의 전력 소비가 안전하고 신뢰할 수 있으며 경제적임을 보장해야 합니다. 지식 그래프는 급전 범위 내 변전소 간의 송전 관계, 변전소 내 설비 배선 관계, 발전소 내 설비 배선 관계 등의 정보를 통합하고, 변전소의 실시간 운전 상태와 결합하는 데 활용됩니다. 글로벌 관점에서 최적의 비상대응을 달성하기 위한 전력망 디지털 트윈 맵 구축을 위한 전력망 전력복구 전략, 기업간 데이터 연계, 설비 결함 조기경보, 영향 범위 분석 등의 기능

소셜 분야에서 소셜 네트워크는 인터넷에 등장한 이후 가장 빠르게 성장하는 인터넷 애플리케이션이 되었습니다. 우리는 일상생활에서 수많은 여론정보를 받아왔고 네트워크 키보드 워리어였을 수도 있다고 생각합니다.사회적 환경에서 사용자는 정보의 수신자일 뿐만 아니라 정보의 생산자, 처리자, 전파자이기도 합니다. 소셜 사용자들은 Twitter-2010과 같은 거대한 사용자 관계 네트워크를 형성하는 방법을 통해 서로 팔로우합니다. 지식 그래프는 소셜 네트워크의 방대한 정보를 활용해 연관 그래프를 구축해 소셜 정보 분석, 관심 사용자 추천, 네트워크 여론 조기 경보 등의 기능을 구현한다. 예를 들어, 지식 그래프는 사용자의 검색 습관, 소비 습관, 오락 습관 등을 기반으로 관심도 그래프를 구축하고, 특정 취미를 가진 사람이나 조직을 정확하게 분류하여 사용자에게 관심 있는 사람, 사물, 사물을 추천할 수 있다. . 짧은 동영상 소프트웨어와 스트리밍 미디어에서는 우리가 관심을 갖는 동영상이 항상 보이고, 관련성이 낮은 콘텐츠는 거의 등장하지 않습니다.이것은 사용자의 선호도에 따라 추천을 하여 사용자 충성도를 높이는 지식 그래프입니다.

소매 분야에서는 과거 판매자 중심의 시장과 달리 오늘날의 전자상거래 모델은 구매자 중심의 시장입니다. 쇼핑이 필요해 소매시장이 되는가?도메인 상품 추천의 문제. 전자상거래 지식 그래프는 사용자의 요구에서 출발하여 사용자의 탐색 습관, 구매 내역, 사회적 행동 및 기타 데이터를 통합하고 상품 카테고리별 잠재 사용자 그룹을 분석하여 지능적인 추천과 정확한 마케팅을 실현하고 구매자에게 좋은 쇼핑을 제공합니다. 경험을 제공하며, 가맹점의 이익도 극대화합니다.

위는 지식 그래프의 광범위한 응용 시나리오에 대한 소개입니다. Chuanglin Technology 공식 웹사이트에서는 신용카드 응용 프로그램 사기 방지 및 전력망 지능형 파견과 같은 그래프의 데모 데모를 제공합니다. 관심 있는 독자는 공식 웹사이트에 로그인하여 탐색할 수 있습니다. 자신에. 물론 지식 그래프는 의료, 공무, 교육, 공공 보안 등의 분야에서도 널리 사용되고 있는데, 구체적인 구현 시나리오를 기반으로 지식 그래프의 적용 사례를 엔터티 모델링, 데이터 매핑 관점에서 자세히 설명하겠습니다. , 시각적 디스플레이 및 비즈니스 분석.

지식그래프 산업 현황

디지털 경제의 지속적인 발전과 딥러닝 기술 및 NLP 기술의 성숙으로 인해 지식 그래프의 산업화가 현재 시장 레이아웃의 초점이 되었습니다. iResearch가 발표한 '2022년 중국 지식 그래프 산업 연구 보고서'에 따르면, 지식 그래프 핵심 시장 규모는 2021년 107억 위안에 이를 것으로 예상되며, 2026년에는 해당 규모가 연평균 296억 위안을 넘어설 것으로 예상된다. 2021~2026년 성장률 평균 성장률은 22.5%에 달하며 지식 지도 관련 양대 산업인 금융과 공공 보안이 시장 규모의 주요 원동력으로 산업 규모가 급속한 발전 추세를 보이고 있다. 앞으로 디지털 정부가 더욱 발전하고 산업이 성숙해짐에 따라 정부 지식 그래프도 시장의 중요한 원동력 중 하나가 될 것입니다.

현재 연구 보고서의 내용을 토대로 볼 때, 지식 그래프 구축의 주요 어려움은 데이터 거버넌스, 업계 전문가 보유량, 기본 그래프 데이터베이스 저장, 개선이 필요한 알고리즘 생산 프로세스 및 성능, 함양해야 할 고객 인식 및 최적화가 필요한 제품 포장. 위에서 언급한 지식 그래프 구축의 어려움을 극복하면 원본 데이터의 신뢰성과 신뢰성을 보장하는 동시에 업계의 종합적인 인재를 양성하는 데 도움이 될 것입니다. 기본 그래프 데이터베이스 저장 방법을 업그레이드하고 알고리즘 성능을 개선하며 제품 사용성을 최적화하는 것도 도움이 될 것입니다. help 지식그래프 산업의 성장을 도와드립니다.

기본 그래프 데이터베이스의 저장 방법 업그레이드에 대해 말하자면, 현재 그래프 기술 개발은 Graph3.0 시대에 접어들었습니다. 이 시대의 기본 그래프 데이터베이스는 빠른 컴퓨팅, 높은 확장성 및 지능을 특징으로 합니다. 그래프 데이터베이스는 기본 그래프 저장소를 사용하므로 데이터는 최하위 계층의 그래프 구조에 직접 저장되고, 알고리즘 계층에서는 그래프 구조 데이터에 대한 쿼리 최적화가 수행되므로 낮은 데이터 확장과 높은 알고리즘 성능을 달성할 수 있습니다. 현재 Graph3.0으로 대표되는 국내 그래프 데이터베이스 제품에는 기본 그래프 저장 아키텍처를 채택한 Galaxybase가 포함되어 있으며, 이는 지식 그래프 구축 과정에서 기본 그래프 데이터베이스 저장 문제를 어느 정도 해결합니다.

지식 그래프 개발 동향

미래는 인지지능(Cognitive Intelligence) 시대입니다.지각지능은 팔다리와 같고, 인지지능은 뇌와 같습니다.뇌는 정보에 대한 지식 추출과 비즈니스 시나리오 추론 및 분석을 수행하여 AI에 대한 이해 및 분석 능력을 향상시킬 수 있습니다. 그 중에서 지식 그래프는 상황을 타개하고, 암묵적인 관계와 논리에 대한 통찰을 인지 지능에 제공하고, 비즈니스 결정을 내리는 데 핵심적인 역할을 할 것입니다. 동시에, 인지 지능 시대의 기반 기술인 지식 그래프도 급속한 발전을 가져올 것입니다.

데이터의 양이 기하급수적으로 증가하고 변화가 순간적으로 진행됨에 따라 미래의 지식 그래프는 기업의 기회를 포착하고 가치를 창출하기 위해 더 커질 뿐만 아니라 더 빨라야 한다고 믿습니다. 지식 그래프의 기본 기둥인 그래프 데이터베이스는 향후 수요에 대비하기 위해 스토리지 및 컴퓨팅 성능을 지속적으로 최적화해야 합니다.

물론 완벽한 기술은 없으며 기술 통합은 미래 산업 발전의 추세이기도 합니다. 서로의 장점을 배우고 단점을 보완하는 것은 지식 그래프의 적용에 더 도움이 될 것이며, 이를 통해 지속적으로 연마를 개선하고 성공적인 경험을 복제하여 더 많은 솔루션을 만들 수 있습니다.

Supongo que te gusta

Origin blog.csdn.net/qq_41604676/article/details/133135168
Recomendado
Clasificación