Artikelverzeichnis
1. Einführung in die medizinische Bildgebung
Unter medizinischer Bildgebung versteht man die Untersuchung der Interaktion mit dem menschlichen Körper mithilfe eines bestimmten Mediums (z. B. Röntgenstrahlen, elektromagnetische Felder, Ultraschall usw.) und zeigt die Struktur und Dichte innerer Gewebe und Organe in Form von Bildern an für Diagnostiker, um Informationen basierend auf den Bildern bereitzustellen. Es handelt sich um eine Wissenschaft, die den Gesundheitszustand des Menschen durch Urteile bewertet, einschließlich zwei relativ unabhängiger Forschungsrichtungen medizinischer Bildgebungssysteme und medizinischer Bildverarbeitung.
Zu den Instrumenten gehören hauptsächlich Röntgenbildgebungsgeräte, CT (normale CT, Spiral-CT), Positronen-Emissions-Tomographie (PET), Ultraschall (Sub-B-Ultraschall, Farb-Doppler-Ultraschall, Herz-Farb-Doppler-Ultraschall, dreidimensionaler Farb-Doppler-Ultraschall) und Magnet Resonanzbildgebung (MRT), Elektrokardiogrammgeräte, EEG-Geräte usw.
2. Einführung in DICOM-Dateien
DICOM (Digital Imaging and Communications in Medicine) ist ein internationaler Standard (ISO 12052) für medizinische Bilder und zugehörige Informationen. DICOM wird häufig in der medizinischen Radiologie, der kardiovaskulären Bildgebung und in radiologischen Diagnosegeräten (Röntgen, CT, Kernspinresonanz, Ultraschall usw.) verwendet und wird zunehmend auch in anderen medizinischen Bereichen wie der Augenheilkunde und der Zahnmedizin eingesetzt. Alle medizinischen Patientenbilder werden im DICOM-Dateiformat gespeichert. Dieses Format enthält PHI-Informationen (geschützte Gesundheitsinformationen) über den Patienten, wie z. B. Name, Geschlecht, Alter, und andere bildbezogene Informationen wie Informationen über das Gerät, das das Bild aufgenommen und erzeugt hat, sowie einige medizinische kontextbezogene Informationen. Medizinische Bildgebungsgeräte erzeugen DICOM-Dateien, die Ärzte mit DICOM-Lesegeräten (Computersoftware, die DICOM-Bilder anzeigen kann) verwenden, um in den Bildern gefundene Probleme zu lesen und zu diagnostizieren.
Der derzeit angenommene Standard ist DICOM3.0, und jedes Bild enthält eine große Menge an Informationen, die in die folgenden vier Kategorien unterteilt werden können: (a) Patient (b) Studie (c) Serie (d) Bild . Jedes DICOM-Tag wird durch eine Kombination aus zwei Hexadezimalzahlen bestimmt, nämlich Gruppe und Element. Beispielsweise stellt das Tag (0010,0010) den Patientennamen dar, der den Namen des Patienten in diesem DICOM-Bild speichert.
C++-basiertes DCMTK, Java-basiertes dcm4che und Python-basiertes pydicom sind allesamt hervorragende Bibliotheken von Drittanbietern zur Interpretation des DICOM-Standards. Durch ihre Einführung in das Projekt können Softwareentwickler die zugrunde liegende Analysearbeit vermeiden, die für das Projekt verwendet werden kann Entwicklung. Verbesserung der Effizienz.
Derzeit werden bei CT, Kernspinresonanz, Ultraschall usw. präzise gebündelte Röntgenstrahlen, γ-Strahlen, Ultraschall usw. zusammen mit hochempfindlichen Detektoren verwendet, um einen bestimmten Teil des menschlichen Körpers nacheinander zu scannen , also die nach dem Scannen erhaltenen Ergebnisse Das Bild ist ein mehrschichtiges Bild, und wir können ein dreidimensionales Bild erstellen, indem wir Bildschichten auf der Z-Achse stapeln (dies bringt das Problem der dreidimensionalen Rekonstruktion mit sich). Zu diesem Zeitpunkt Wir können Dicom-Bilder in jeder Ebene speichern. In der Datei (natürlich enthält die Dicom-Datei nicht nur Pixelinformationen, sondern auch viele Datenheaderinformationen), wie in der folgenden Abbildung gezeigt, besteht unser Zweck darin, diese Daten zu lesen Es kommen Header-Informationen und Pixelinformationen aus einer Reihe von Dicom-Dateien heraus.
Eine DICOM-Datei bezieht sich auf eine medizinische Datei, die gemäß dem DICOM-Standard gespeichert ist. Sie besteht im Allgemeinen aus einem DICOM-Dateikopf und einem DICOM-Datensatz
. Ein Dateikopf:
- Die Präambel der Datei besteht aus 128 Bytes;
- Mit dem DICOM-Präfix können Sie beurteilen, ob es sich bei der Datei um eine DICOM-Datei handelt, je nachdem, ob die 4-Byte-Zeichenfolge „DICM“ entspricht.
- Dokumentinformationselement
3. Detaillierte Erläuterung der internen DICOM-Informationen (DICOM-Tag und VR)
Ein DICOM-Datensatz ist die Hauptkomponente einer DICOM-Datei, die aus DICOM-Datenelementen besteht, die in einer bestimmten Reihenfolge angeordnet sind. Die grundlegendste Dateneinheit eines Datenelements ist ein Datenelement, das in aufsteigender Reihenfolge nach TAG angeordnet ist, dh ein Datenelement stellt einen TAG dar. Das Datenelement besteht im Wesentlichen aus 4 Teilen:
- TAG-Nummer : besteht aus 4 Bytes, einschließlich einer 2-Byte-Gruppennummer und einer 2-Byte-Elementnummer (zum Beispiel: 0010, 0040 gibt das Geschlecht des Patienten an, und die Gruppennummer: 0002 beschreibt die Gerätekommunikationsinformationen, 0008 beschreibt die charakteristische Parameter, 0010 Patienteninformationen beschreiben, 0028 Bildinformationsparameter beschreiben ). Wenn die relevanten Daten der DICOM-Datei benötigt werden, werden diese gemäß dem TAG abgerufen.
- Wertdarstellung (VR, Wertdarstellung) : Sie besteht aus zwei Zeichenbytes und speichert den Datentyp, der die Metadateninformationen des Elements beschreibt, einschließlich zum Beispiel: LO (Long String, lange Zeichenfolge), IS (Integer String, ganzzahliges Zeichen). String), DA (Daten, Datum) usw. insgesamt 27 Datentypen.
- Wertlänge (Wertlänge) : Speichern Sie die Länge der Daten, die die Informationen beschreiben.
- Wertfeld (Wert) : speichert den Datenwert, der die Informationen dieses Elements beschreibt.
Die Datenmetadateninformationen können nach unterschiedlichen Informationen in 4 Kategorien unterteilt werden: - Patient - Studie - Serie - Bild -. Es versteht sich, dass ein Patient ( Patient ) mehreren Untersuchungen ( Studien ) unterzogen werden kann und eine Untersuchung mehrere Untersuchungsorte ( Serien ) umfasst und jeder Untersuchungsort über ein oder mehrere entsprechende Bilder ( Bild ) verfügt.
1. Gemeinsame Tags
(1) Patienten-Tag
Gruppe | Element | Tag-Beschreibung | Chinesische Erklärung | Datentyp (VR) |
---|---|---|---|---|
0010 | 0010 | Patientenname | Patientenname | PN |
0010 | 0020 | Patienten ID | Patienten ID | LO |
0010 | 0030 | Geburtsdatum des Patienten | Geburtsdatum des Patienten | UND |
0010 | 0032 | Geburtszeit des Patienten | Geburtszeit des Patienten | TM |
0010 | 0040 | Geschlecht des Patienten | Geschlecht des Patienten | CS |
0010 | 1030 | Gewicht des Patienten | Patientengewicht | DS |
0010 | 21C0 | Schwangerschaftsstatus | Schwangerschaftsstatus | UNS |
(2) Studien-Tag
Gruppe | Element |
|
|
Datentyp (VR) |
---|---|---|---|---|
0008 | 0050 | Zugangsnummer: Eine von RIS generierte Nummer, die die Reihenfolge der Studie identifiziert. |
Inspektionsnummer: Sequenznummer der RIS-Generierung, die zur Identifizierung der Inspektionsreihenfolge verwendet wird |
Sch |
0020 | 0010 | Studienausweis | Ausweis prüfen | Sch |
0020 | 000D | UID der Studieninstanz: Eindeutige Kennung für die Studie. |
Prüfungsinstanznummer: Eindeutige Identifikationsnummer für verschiedene Prüfungen |
Benutzeroberfläche |
0008 | 0020 | Studiendatum: Datum, an dem die Studie begann. |
Inspektionsdatum: Das Datum, an dem die Inspektion begann |
UND |
0008 | 0030 | Studienzeit: Zeitpunkt, zu dem die Studie begann. |
Prüfzeit: Die Zeit, zu der die Prüfung begann |
TM |
0008 | 0061 | Modalitäten im Studium | In einer Prüfung sind verschiedene Prüfungsarten enthalten | CS |
0008 | 0015 | Körperteil untersucht | Überprüfen Sie die Website | CS |
0008 | 1030 | Studienbeschreibung | Überprüfen Sie die Beschreibung | LO |
0010 | 1010 | Alter des Patienten | Das Alter des Patienten zum Zeitpunkt der Untersuchung, nicht das aktuelle Alter des Patienten | ALS |
(3) Serien-Tag
Gruppe | Element |
|
|
Datentyp (VR) |
---|---|---|---|---|
0020 | 0011 | Seriennummer: Eine Nummer, die diese Serie identifiziert. |
Seriennummer: eine Nummer, die die verschiedenen Schecks identifiziert |
IST |
0020 | 000E | Serieninstanz-UID: Eindeutige Kennung für die Serie. |
Sequenzinstanznummer: Eindeutige Identifikationsnummer für verschiedene Sequenzen |
Benutzeroberfläche |
0008 | 0060 | Modalität | Modalität prüfen (MRT/CT/CR/DR) | CS |
0008 | 103E | Serienbeschreibung | Überprüfen Sie die Beschreibung und Anweisungen | LO |
0008 | 0021 | Seriendatum | Prüfdatum | UND |
0008 | 0031 | Serienzeit | überprüfe die Zeit | TM |
0020 | 0032 | Bildposition (Patient): Die X-, Y- und Z-Koordinaten der oberen linken Ecke des Bildes in mm. |
Bildposition: Die xyz-Koordinaten der oberen linken Ecke des Bildes im Raumkoordinatensystem, die Einheit ist mm. Bei der Inspektion die Koordinaten der oberen linken Ecke des ersten Bildes in der Sequenz. |
DS |
0020 | 0037 | Bildausrichtung (Patient): Der Richtungskosinus der ersten Zeile und der ersten Spalte in Bezug auf den Patienten. |
Bildausrichtung | DS |
0018 | 0050 | Scheibendicke: Nominelle Scheibendicke in mm. |
Schichtdicke | DS |
0018 | 0088 | Abstand zwischen Slices | Der Abstand zwischen den Schichten in mm | DS |
0020 | 1041 | Schichtposition: Relative Position der Belichtung, ausgedrückt in mm. |
Tatsächliche relative Position in mm | DS |
0018 | 0023 | MR-Erwerb | CS | |
0018 | 0015 | Körperteil untersucht | Körperteile | CS |
(4) Bild-Tag
Gruppe | Element |
|
|
Datentyp (VR) |
---|---|---|---|---|
0008 | 0008 | Bildtyp: Bildidentifikationsmerkmale. |
CS | |
0008 | 0018 | SOP-Instanz-UID | SOP-Instanz-UID | |
0008 | 0023 | Inhaltsdatum: Das Datum, an dem mit der Erstellung der Bildpixeldaten begonnen wurde. |
Datum der Bildaufnahme | UND |
0008 | 0033 | Content Time | 影像拍摄时间 | TM |
0020 | 0013 | Image/Instance Number: A number that identifies this image. |
图像码: 识别图像的号码 |
IS |
0028 | 0002 | Samples Per Pixel: Number of samples (planes) in this image. |
图像采样率 | US |
0028 | 0004 | Photometric Interpretation: Specifies the intended interpretation of the pixel data. |
光度计解释: 对于CT图像,用两个枚举值MONOCHROME1,MONOCHROME2 用来判断图像是否是彩色的; MONOCHROME 1/2是灰度图,RGB则是真彩色图 |
CS |
0028 | 0010 | Rows : Number of rows in the image. | 图像的总行数,行分辨率 | US |
0028 | 0011 | Columns : Number of columns in the image. | 图像的总列数,列分辨率 | US |
0028 | 0030 | Pixel Spacing: Physical distance in the patient between the center of each pixel. |
像素间距: 像素中心之间的物理间距 |
DS |
0028 | 0100 | Bits Allocated: Number of bits allocated for each pixel sample.Each sample shall have the same number of bits allocated. |
分配的位数: 存储每一个像素值时分配的位数,每一个样本该值相同 |
US |
0028 | 0101 | Bits Stored: Number of bits stored for each pixel sample.Each sample shall have the same number of bits stored. |
存储的位数:有12到16列举值 存储每一个像素用的位数,每一个样本该值相同 |
US |
0028 | 0102 | High Bit: Most significant bit for pixel sample data. Each sample shall have the same high bit. |
高位 | US |
0028 | 0103 | Pixel Representation: Data representation of the pixel samples. Each sample shall have the same pixel representation. Enum:0000H=unsigned integer,0001H=2’ s complement. |
像素数据的表现类型: 一个枚举值,分别为十六进制数0000和0001. 0000H = 无符号整型, 0001H = 2的补码 |
US |
0028 | 1050 | Window Center | 窗位 | DS |
0028 | 1051 | Window Width | 窗宽 | DS |
0028 | 1052 | Rescale Intercept: The value b in relationship between stored values(SV) and the output units. Output units = m*SV + b. Required if Modality LUT Sequence(0028, 0030) is not present. |
截距: 如果表明不同模态的LUT颜色对应表不存在时,则使用方程: Units = m*SV + b,计算真实的像素值到呈现像素值,其中截距为表达式中的b |
DS |
0028 | 1053 | Rescale Slope: m in the equation specified by Rescale Intercept(0028, 1052). Required if Rescale Intercept is present. |
斜率: 该值为表达式中的m |
DS |
0028 | 1054 | Rescale Type: Specifies the output units of Rescale Slope (0028,1053) and Rescale Intercept (0028,1052). Enum: US=Unspecified Requried if Photometric Interpretation is MONOCHROME2, and Bits Stored is greater than 1. This specifies an identity Modality LUT transformation. |
输出值的单位: 该值是一个枚举值 |
LO |
2.VR数据类型
VR是DICOM标准中用来描述数据类型的,总共有27个值。
27种数据类型
|
|
允许字符 | 数据长度 |
---|---|---|---|
CS - Code String 代码字符串 |
开头结尾可以有没有意义的空格的字符串,比如 “CD123_4" | 大写字母,0-9,空格以及下划线字符 | 最多16个字符 |
SH - Short String 短字符串 |
短字符串,比如:电话号码, ID 等 | 最多16个字符 | |
LO - Long String 长字符串 |
一个字符串,可能在开头、结尾填有空格。比如 “Introduction to DICOM” | 最多64个字符 | |
ST - Short Text 短文本 |
可能包含一个或多个段落的字符串 | 最多1024个字符 | |
LT - Long Text 长文本 |
可能包含一个或多个段落的字符串,与 LO 相同,但可以更长 | 最多10240个字符 | |
UT - Unlimited Text 无限制文本 |
包含一个或多个段落的字符串,与 LT 类似 | 最多(232 -2)个字符 | |
AE - Application Entity 应用实体 |
标识一个设备的名称的字符串,开头和结尾可以有无意义的字符。比如 “MyPCO 1” | 最多16个字符 | |
PN - Person Name 病人姓名 |
有插入符号 (^) 作为姓名分隔符的病人姓名。比如 “SMITH^JOHN” “Morrison Jones Susan^^^Ph.D,Chief Executive Officer” |
最多64个字符 | |
UI - Unique Identifier(UID) 唯一标识符 |
一个用作唯一标识各类项目的包含UID的字符串。比如 “1.2.840.10008.1.1” | 0-9和半角句号 (.) | 最多64个字符 |
DA - Date 日期 |
格式为 YYYYMMDD 的字符串;YYYY 代表年;MM 代表月;DD 代表日。比如 “20050822” 表示 2005 年 8 月 22 日 | 0-9 | 8个字符 |
TM - Time 时间 |
格式为 HHMMSS.FRAC 的字符串。 HH 表示小时(范围"00"-“23”); MM 表示分钟 (范围"00"-“59”); 而 FRAC 包含秒的小数部分,即百万分之一秒, 比如 “183200.00” 表示下午 6:32 |
0-9和半角句号 (.) | 最多16个字符 |
DT - Date Time 日期时间 |
格式为 YYYYMMDDHHMMSS.FFFFFF,串联的日期时间字符串。 字符串的各部分从左至右是:年-YYYY;月-MM;日-DD;小时-HH;分钟-MM;秒-SS;秒的小数-FFFFFF。 比如 “20050812183000.00” 表示 2005 年 8 月 12 日 下午 18 点 30 分 00 秒 |
0-9,加号,减号和半角句号 | 最多26个字符 |
AS - Age String 年龄字符串 |
符合以下格式的字符串:nnnD,nnnW,nnnM,nnnY;其中 nnn 对于 D 来说表示天数,对于 W 来说表示周数,对于 M 来说表示月数,对于 Y 来说表示岁数。比如 “018M” 表示他的年龄是 18 个月 | 0-9,D,W,M,Y | 4个字符 |
IS - Integer String 整型字符串 |
表示一个整型数字的字符串,比如 “-1234567” | 0-9,加号 (+),减号 (-) | 最多12个字符 |
DS - Decimal String 小数字符串 |
表示定点小数和浮点小数,比如 “12345.67”, “-5.0e3” | 0-9, 加号 (+), 减号 (-), 最多16个字符 E, e 和半角句号(.) | 最多16个字符 |
SS - Signed Short 有符号短型 |
符号型二进制整数,长度 16 bits | 2个字符 | |
US - Unsigned Short 无符号短型 |
无符号二进制整数,长度 16 bits | 2个字符 | |
SL - Signed Long 有符号长型 |
有符号二进制整数 | 4个字符 | |
UL - Unsigned Long 无符号长型 |
无符号二进制长整数,长度 32 bits | 4个字符 | |
AT - Attribute Tag 属性标签 |
16 bits 无符号整数的有序对,数据元素的标签 | 4个字符 | |
FL - Floating Single 单精度浮点型 |
单精度二进制浮点数 | 4个字符 | |
FD - Floating Point Double 双精度二进制浮点型 |
双精度二进制浮点数 | 8个字符 | |
OB - Other Byte String 其它字节字符串 |
字节的字符串("其它"表示没有在VR中定义的内容) | ||
OW - Other Word String 其它单词字符串 |
16 bits(2字节) 单词字符串 | ||
OF – Anderer Float-String, anderer Gleitkomma-String |
32 Bit (4 Bytes) Gleitkomma-Wortzeichenfolge | ||
SQ – Sequenzelemente -Eingabesequenz |
Reihenfolge der Einträge | ||
UN – Unbekannt unbekannt |
Eine Bytefolge, deren Inhalt unbekannt ist |
Referenz: