実際の質問と他の質問の解決策を確認したい学生は、CCF-CSP の実際の質問と解決策にアクセスしてください。
質問番号: | 202305-3 |
質問名: | 解凍する |
制限時間: | 5.0秒 |
メモリ制限: | 512.0MB |
問題の説明: | トピックの背景シシ イヴェール アイランド オペレーティング カンパニーは、島のインフラの維持と運用を担当する大企業です。社内には、サーバー設備を使用する必要があるさまざまな業務を担当する部門が数多くあります。管理を容易にし、会社の運営コストを削減するために、 ログ サーバーによって収集されるログはすべてプレーン テキストであり、高度にフォーマットされています。これは、ログ データを非常に小さく圧縮できることを意味します。ただし、ログ データの量は非常に多く、処理効率に対する要求も高いため、一定の圧縮率を犠牲にして、効率的な圧縮アルゴリズムを使用してログ データを圧縮することができます。 問題の説明この圧縮アルゴリズムによって生成されたデータ ストリームは、一連の要素とみなすことができます。要素には、リテラルと後方参照の 2 種類があります。リテラルには一連のバイトが含まれており、解凍すると、これらのバイトを直接出力できます。 圧縮データ形式は、ブート フィールドとデータ フィールドの 2 つの部分に分かれています。このうち、ブートフィールドは元のデータの長さを保存します。元のデータ長をnとします。この場合、n は ∑k=0dck×128k (0≤ck<128、
データ フィールドには、連続して格納される一連の要素である圧縮データが格納されます。各要素の最初のバイトの下位 2 ビットは、要素のタイプを示します。最下位 2 ビットが 0 の場合、これはリテラル値であることを意味します。リテラルに含まれるバイト数が l で、l ≤60 の場合、
要素の最初のバイトの下位 2 ビットが である場合
例如,字节
当元素首字节的最低两位是
我们规定,元素的首字节的最低两位不允许是 压缩后的数据为合法的,当且仅当以下条件都满足:
输入格式从标准输入读入数据。 输入包含有若干行,第一行是一个正整数 s,表示输入被解压缩数据的字节数。 接下来有 ⌈s8⌉ 行,表示输入的被解压缩的数据。每行只含有数字或字母 输出格式输出到标准输出中。 输出解压缩后的数据,每行连续输出 8 个字节,每个字节由两位十六进制数字(数字或字母 样例输入
样例输出
样例说明上述输入数据可以整理为:
首先读入第一字节 然后继续读入字节 然后继续读入字节 然后继续读入字节 然后继续读入字节 此时,输入已经处理完成,共输出了 10+61+50+7=128 字节,与从引导区中读入的原始数据长度一致,因此解压缩成功。 子任务对于 10% 的输入,解压缩后的数据长度不超过 127 字节,且仅含有字面量,每个字面量元素所含数据的长度不超过 60 字节; 对于 20% 的输入,解压缩后的数据长度不超过 1024 字节,且仅含有字面量,每个字面量元素所含数据的长度不超过 60 字节; 对于 40% 的输入,解压缩后的数据长度不超过 1024 字节,且仅含有字面量; 对于 60% 的输入,解压缩后的数据长度不超过 1024 字节,且包含的回溯引用的首字节的最低两位都是 对于 80% 的输入,解压缩后的数据长度不超过 4096 字节; 对于 100% 的输入,解压缩后的数据长度不超过 2MiB(2×220 字节),且 s≤2×106,且保证是合法的压缩数据。 |
真题来源:解压缩
感兴趣的同学可以如此编码进去进行练习提交
题目理解:
ブート フィールドとデータ フィールドに分割できる圧縮コードを用意します。ブート フィールドは解凍されたデータの長さを決定し、データ フィールドもセグメント化できます。各セグメントは下位 2 ビットによって決定されます。最初のバイトの 、00 の場合はリテラル値、01 または 10 の場合は後方参照です。解凍されたデータを 1 行 8 バイトで出力します。最後の行は 8 バイト未満を許可します。
アイデア分析:
バイトは何度も読み取られるため、 バイトを読み取って 現在の読み取り位置を記録する関数をカプセル化するのが最善です。文字列はリトル エンディアン順に調整する必要があるため、文字列をリトル エンディアン順に調整する関数をカプセル化することを検討できます 。01 と 10 は両方とも後方参照で終わるため、関数をカプセル化して 文字列を埋めることもできます 。バイトを扱うのは面倒なので、 stoi() - 符号付き整数 または stoul - 符号なし整数を使用して 16 進数変換を実行できます。
C++ フルスコア ソリューション:
#include <bits/stdc++.h>
using namespace std;
const int N = 2e6 + 10;
int n, idx, p; // 当前已经解压缩了 p 字节,下一个读的是第 idx 下标的字符
string res; // 解压后的数据
string readBytes(int num)
{
char byte[2 * num];
for (int i = 0; i < 2 * num; i ++) cin >> byte[i];
idx += num * 2;
return string(byte, 2 * num);
}
void trackBack(int o, int l)
{
int start = res.length() - o * 2;
int len = o * 2;
string back_track_string = res.substr(start, len);
int cnt = 0;
while (cnt < l * 2 - l * 2 % len)
{
res += back_track_string;
cnt += len;
}
res += back_track_string.substr(0, l * 2 % len);
}
int main()
{
cin >> n;
string bts;
vector<int> c;
int v_c;
// 读入字节 直到最高位为0
while ((bts = readBytes(1)) >= "80")
{
v_c = stoi(bts, nullptr, 16);
v_c -= 128;
c.push_back(v_c);
}
// 最高位为0时,直接保存到c里
v_c = stoi(bts, nullptr, 16);
c.push_back(v_c);
// 引导区结束,计算原始数据长度
int length = 0;
for (int i = 0; i < c.size(); i ++) length += c[i] * pow(128, i);
while (idx < n * 2)
{
// 接下来是数据域
// 读入一个字节
bts = readBytes(1);
string string_to_binary = bitset<8>(stoi(bts, nullptr, 16)).to_string();
string lowest_two_digits = string_to_binary.substr(6, 2);
if (lowest_two_digits == "00")
{
string high_six_digits = string_to_binary.substr(0, 6);
int ll = stoi(high_six_digits, nullptr, 2);
// l <= 60,高六位 ll 表示 l - 1
if (ll <= 59)
res += readBytes(ll + 1);
else
{
// 第一个字节的高六位存储的值为 60、61、62 或 63 时,分别代表 l - 1 用 1、2、3 或 4 个字节表示
int literal_length = ll - 59;
// 按照小端序重组字符串 0x01 0x0A => 0x0A01
string string1 = readBytes(literal_length);
string string2;
// 字符串每两位反转
for (int i = string1.length() - 2; i >= 0; i -= 2)
string2 += string1.substr(i, 2);
int l = 1 + stoi(string2, nullptr, 16); // 字面量长度
res += readBytes(l);
}
}
else if (lowest_two_digits == "01")
{
// 第 2 ~ 4 位即 从下标 3 开始的三位 001 011 01
string two_to_four_digits = string_to_binary.substr(3, 3);
// l - 4 占 3 位,存储于首字节的 2 至 4 位中
int l = stoi(two_to_four_digits, nullptr, 2) + 4;
// o 占 11 位,其低 8 位存储于随后的字节中,高 3 位存储于首字节的高 3 位中
string high_three_digits = string_to_binary.substr(0, 3);
string next_byte_binary = bitset<8>(stoi(readBytes(1), nullptr, 16)).to_string();
int o = stoi(high_three_digits + next_byte_binary, nullptr, 2);
// 回溯引用
trackBack(o, l);
}
else if (lowest_two_digits == "10")
{
string high_six_digits = string_to_binary.substr(0, 6);
// l 占 6 位,存储于首字节的高 6 位中
int l = stoi(high_six_digits, nullptr, 2) + 1;
// o 占 16 位,以小端序存储于随后的两个字节中
string string1 = readBytes(2);
string string2;
// 字符串每两位反转
for (int i = string1.length() - 2; i >= 0; i -= 2)
string2 += string1.substr(i, 2);
int o = stoi(string2, nullptr, 16);
// 回溯引用
trackBack(o, l);
}
}
for (int i = 0; i < res.length(); i ++)
{
cout << res[i];
// 输出,每16个字符加一个换行
if ((i + 1) % 16 == 0) cout << endl;
}
// 若最后一行不能凑8个,则补一个换行
if (res.length() % 16) cout << endl;
return 0;
}
操作結果: