zlibは圧縮されたPDFを解凍します(キーワードFlateDecode)

PDFは圧縮されていますが、インターネットからのこの圧縮アルゴリズムはzlibの圧縮アルゴリズムです。次の文字化けコードは圧縮によって発生した文字化けコードです。次に、これらの文字化けコードを復元する必要があります。

%PDF-1.7
%溷弦
4 0 obj
<</Length 3 0 R/Filter/FlateDecode>>
stream
x渆QMK聾}&跉MIb郦Q鰳娵R刍??焱zR<
?|3狣B6?颿f?滕,鞃?珈毵辊纡拶迨鷚#Ef? B?]蔑!?腊}?嫖?畴滁!鈠?v僣$貇憮b勴72?
溔%f."@4擫忶睵?舊?犼\銭/'S/鱐篖x!籤&鈾'Q:?肶O鷾p罷琑厹T?(?5-
瞪苑趬nf舣].O跧9n悪v驼寏w?W</僰?溏D_槠{耑`_佄D崣j旮c楣?[?蟒驱 躚7Q
endstream
endobj
3 0 obj
280
endobj
  1. Win32アプリケーションzlib_testをビルドします(私が使用するVS2010)
  2. Zlibは以前にコンパイルされたことがあり、zlib static libをコンパイルする方法がわからない場合は、それを調べることができます。
  3. プロジェクトにzlibを追加するには、静的ライブラリを追加し、zlib.libをプロジェクト(* .vcxprojが配置されている場所)ディレクトリに配置します。
  4. プロジェクト->プロパティ->構成プロパティ->リンカ->入力->追加の依存関係-> zlib.libの追加
  5. プロジェクト->プロパティ->構成プロパティ-> VC ++ディレクトリ->ライブラリディレクトリ追加$(ProjectDir)
  6. プロジェクト->プロパティ->構成プロパティ-> VC ++ディレクトリ->ディレクトリの追加$(ProjectDir)\ includeを追加
  7. プロジェクトディレクトリにincludeを作成し、zlibのすべての.hファイルをコピーします
  8. 申し訳ありませんが、プロジェクトを作成する必要のない例がzlibにあることがわかりました
  9. 解凍された「ソリューション」でtestzlibを直接使用します。SourceFileにはtestzlib.cがあります。これは、圧縮と解凍の例です。
  10. コードを投稿します。恐れることはありません。これは元のコードに基づいて変更したものです。実際のコードはごくわずかです。後で参照してください。

#include <stdio.h>
#include <stdlib.h>
#include <windows.h>

#include "zlib.h"


void MyDoMinus64(LARGE_INTEGER *R,LARGE_INTEGER A,LARGE_INTEGER B)
{
    R->HighPart = A.HighPart - B.HighPart;
    if (A.LowPart >= B.LowPart)
        R->LowPart = A.LowPart - B.LowPart;
    else
    {
        R->LowPart = A.LowPart - B.LowPart;
        R->HighPart --;
    }
}

#ifdef _M_X64
// see http://msdn2.microsoft.com/library/twchhe95(en-us,vs.80).aspx for __rdtsc
unsigned __int64 __rdtsc(void);
void BeginCountRdtsc(LARGE_INTEGER * pbeginTime64)
{
 //   printf("rdtsc = %I64x\n",__rdtsc());
   pbeginTime64->QuadPart=__rdtsc();
}

LARGE_INTEGER GetResRdtsc(LARGE_INTEGER beginTime64,BOOL fComputeTimeQueryPerf)
{
    LARGE_INTEGER LIres;
    unsigned _int64 res=__rdtsc()-((unsigned _int64)(beginTime64.QuadPart));
    LIres.QuadPart=res;
   // printf("rdtsc = %I64x\n",__rdtsc());
    return LIres;
}
#else
#ifdef _M_IX86
void myGetRDTSC32(LARGE_INTEGER * pbeginTime64)
{
    DWORD dwEdx,dwEax;
    _asm
    {
        rdtsc
        mov dwEax,eax
        mov dwEdx,edx
    }
    pbeginTime64->LowPart=dwEax;
    pbeginTime64->HighPart=dwEdx;
}

void BeginCountRdtsc(LARGE_INTEGER * pbeginTime64)
{
    myGetRDTSC32(pbeginTime64);
}

LARGE_INTEGER GetResRdtsc(LARGE_INTEGER beginTime64,BOOL fComputeTimeQueryPerf)
{
    LARGE_INTEGER LIres,endTime64;
    myGetRDTSC32(&endTime64);

    LIres.LowPart=LIres.HighPart=0;
    MyDoMinus64(&LIres,endTime64,beginTime64);
    return LIres;
}
#else
void myGetRDTSC32(LARGE_INTEGER * pbeginTime64)
{
}

void BeginCountRdtsc(LARGE_INTEGER * pbeginTime64)
{
}

LARGE_INTEGER GetResRdtsc(LARGE_INTEGER beginTime64,BOOL fComputeTimeQueryPerf)
{
    LARGE_INTEGER lr;
    lr.QuadPart=0;
    return lr;
}
#endif
#endif

void BeginCountPerfCounter(LARGE_INTEGER * pbeginTime64,BOOL fComputeTimeQueryPerf)
{
    if ((!fComputeTimeQueryPerf) || (!QueryPerformanceCounter(pbeginTime64)))
    {
        pbeginTime64->LowPart = GetTickCount();
        pbeginTime64->HighPart = 0;
    }
}

DWORD GetMsecSincePerfCounter(LARGE_INTEGER beginTime64,BOOL fComputeTimeQueryPerf)
{
    LARGE_INTEGER endTime64,ticksPerSecond,ticks;
    DWORDLONG ticksShifted,tickSecShifted;
    DWORD dwLog=16+0;
    DWORD dwRet;
    if ((!fComputeTimeQueryPerf) || (!QueryPerformanceCounter(&endTime64)))
        dwRet = (GetTickCount() - beginTime64.LowPart)*1;
    else
    {
        MyDoMinus64(&ticks,endTime64,beginTime64);
        QueryPerformanceFrequency(&ticksPerSecond);


        {
            ticksShifted = Int64ShrlMod32(*(DWORDLONG*)&ticks,dwLog);
            tickSecShifted = Int64ShrlMod32(*(DWORDLONG*)&ticksPerSecond,dwLog);

        }

        dwRet = (DWORD)((((DWORD)ticksShifted)*1000)/(DWORD)(tickSecShifted));
        dwRet *=1;
    }
    return dwRet;
}

int ReadFileMemory(const char* filename,long* plFileSize,unsigned char** pFilePtr)
{
    FILE* stream;
    unsigned char* ptr;
    int retVal=1;
	printf("filename = %s\n",filename);
    stream=fopen(filename, "rb");
    if (stream==NULL){
		printf("stream == NULL\n");
        return 0;
	}

    fseek(stream,0,SEEK_END);

    *plFileSize=ftell(stream);
	printf("*plFileSize = %d\n",*plFileSize);
    fseek(stream,0,SEEK_SET);
    ptr=malloc((*plFileSize)+1);
    if (ptr==NULL)
        retVal=0;
    else
    {
        if (fread(ptr, 1, *plFileSize,stream) != (*plFileSize))
            retVal=0;
    }
    fclose(stream);
    *pFilePtr=ptr;
    return retVal;
}
#if 1

int main(int argc, char *argv[])
{
	const char *uncom_file_name = "uncom.txt";
	long lFileSize1 = 0;
	unsigned char * FilePtr = NULL;
	int err = 0;
	uLongf uncom_len = 1024;
	Bytef uncom_buf[1024];
	memset(uncom_buf,0x00,sizeof(uncom_buf));

	if(ReadFileMemory(uncom_file_name,&lFileSize1,&FilePtr)==0){
		printf("error reading %s\n",uncom_file_name);
		return 1;
	}else{
		printf("file %s read ,%d bytes\n",uncom_file_name,lFileSize1);
	}
	err = uncompress(uncom_buf,&uncom_len,FilePtr,lFileSize1);
	printf("uncom_len = %d\n",uncom_len);
	if (err != Z_OK)
	{
		printf("err = %d\n",err);
		return 1;
	}
	if(FilePtr != NULL)
	{
		free(FilePtr);
		FilePtr = NULL;
	}
	printf("uncom_buf = %s\n",uncom_buf);
	return 0;
}
#else
int main(int argc, char *argv[])
{
    int BlockSizeCompress=0x8000;
    int BlockSizeUncompress=0x8000;
    int cprLevel=Z_DEFAULT_COMPRESSION ;
    long lFileSize;
    unsigned char* FilePtr;
    long lBufferSizeCpr;
    long lBufferSizeUncpr;
    long lCompressedSize=0;
    unsigned char* CprPtr;
    unsigned char* UncprPtr;
    long lSizeCpr,lSizeUncpr;
    DWORD dwGetTick,dwMsecQP;
    LARGE_INTEGER li_qp,li_rdtsc,dwResRdtsc;

    if (argc<=1)
    {
        printf("run TestZlib <File> [BlockSizeCompress] [BlockSizeUncompress] [compres. level]\n");
        return 0;
    }

    if (ReadFileMemory(argv[1],&lFileSize,&FilePtr)==0)
    {
        printf("error reading %s\n",argv[1]);
        return 1;
    }
    else printf("file %s read, %u bytes\n",argv[1],lFileSize);

    if (argc>=3)
        BlockSizeCompress=atol(argv[2]);

    if (argc>=4)
        BlockSizeUncompress=atol(argv[3]);

    if (argc>=5)
        cprLevel=(int)atol(argv[4]);

    lBufferSizeCpr = lFileSize + (lFileSize/0x10) + 0x200;
    lBufferSizeUncpr = lBufferSizeCpr;

    CprPtr=(unsigned char*)malloc(lBufferSizeCpr + BlockSizeCompress);

    BeginCountPerfCounter(&li_qp,TRUE);
    dwGetTick=GetTickCount();
    BeginCountRdtsc(&li_rdtsc);
    {
        z_stream zcpr;
        int ret=Z_OK;
        long lOrigToDo = lFileSize;
        long lOrigDone = 0;
        int step=0;
        memset(&zcpr,0,sizeof(z_stream));
        deflateInit(&zcpr,cprLevel);

        zcpr.next_in = FilePtr;
        zcpr.next_out = CprPtr;


        do
        {
            long all_read_before = zcpr.total_in;
            zcpr.avail_in = min(lOrigToDo,BlockSizeCompress);
            zcpr.avail_out = BlockSizeCompress;
            ret=deflate(&zcpr,(zcpr.avail_in==lOrigToDo) ? Z_FINISH : Z_SYNC_FLUSH);
            lOrigDone += (zcpr.total_in-all_read_before);
            lOrigToDo -= (zcpr.total_in-all_read_before);
            step++;
        } while (ret==Z_OK);

        lSizeCpr=zcpr.total_out;
        deflateEnd(&zcpr);
        dwGetTick=GetTickCount()-dwGetTick;
        dwMsecQP=GetMsecSincePerfCounter(li_qp,TRUE);
        dwResRdtsc=GetResRdtsc(li_rdtsc,TRUE);
        printf("total compress size = %u, in %u step\n",lSizeCpr,step);
        printf("time = %u msec = %f sec\n",dwGetTick,dwGetTick/(double)1000.);
        printf("defcpr time QP = %u msec = %f sec\n",dwMsecQP,dwMsecQP/(double)1000.);
        printf("defcpr result rdtsc = %I64x\n\n",dwResRdtsc.QuadPart);
    }

    CprPtr=(unsigned char*)realloc(CprPtr,lSizeCpr);
    UncprPtr=(unsigned char*)malloc(lBufferSizeUncpr + BlockSizeUncompress);

    BeginCountPerfCounter(&li_qp,TRUE);
    dwGetTick=GetTickCount();
    BeginCountRdtsc(&li_rdtsc);
    {
        z_stream zcpr;
        int ret=Z_OK;
        long lOrigToDo = lSizeCpr;
        long lOrigDone = 0;
        int step=0;
        memset(&zcpr,0,sizeof(z_stream));
        inflateInit(&zcpr);

        zcpr.next_in = CprPtr;
        zcpr.next_out = UncprPtr;


        do
        {
            long all_read_before = zcpr.total_in;
            zcpr.avail_in = min(lOrigToDo,BlockSizeUncompress);
            zcpr.avail_out = BlockSizeUncompress;
            ret=inflate(&zcpr,Z_SYNC_FLUSH);
            lOrigDone += (zcpr.total_in-all_read_before);
            lOrigToDo -= (zcpr.total_in-all_read_before);
            step++;
        } while (ret==Z_OK);

        lSizeUncpr=zcpr.total_out;
        inflateEnd(&zcpr);
        dwGetTick=GetTickCount()-dwGetTick;
        dwMsecQP=GetMsecSincePerfCounter(li_qp,TRUE);
        dwResRdtsc=GetResRdtsc(li_rdtsc,TRUE);
        printf("total uncompress size = %u, in %u step\n",lSizeUncpr,step);
        printf("time = %u msec = %f sec\n",dwGetTick,dwGetTick/(double)1000.);
        printf("uncpr  time QP = %u msec = %f sec\n",dwMsecQP,dwMsecQP/(double)1000.);
        printf("uncpr  result rdtsc = %I64x\n\n",dwResRdtsc.QuadPart);
    }

    if (lSizeUncpr==lFileSize)
    {
        if (memcmp(FilePtr,UncprPtr,lFileSize)==0)
            printf("compare ok\n");

    }

    return 0;
}
#endif
  1. これは現在のコードです

#include <stdio.h>
#include <stdlib.h>
#include <windows.h>

#include "zlib.h"
int ReadFileMemory(const char* filename,long* plFileSize,unsigned char** pFilePtr)
{
    FILE* stream;
    unsigned char* ptr;
    int retVal=1;

    stream=fopen(filename, "rb");
    if (stream==NULL){
		printf("stream == NULL\n");
        return 0;
	}

    fseek(stream,0,SEEK_END);

    *plFileSize=ftell(stream);
    fseek(stream,0,SEEK_SET);
    ptr=malloc((*plFileSize)+1);
    if (ptr==NULL)
        retVal=0;
    else
    {
        if (fread(ptr, 1, *plFileSize,stream) != (*plFileSize))
            retVal=0;
    }
    fclose(stream);
    *pFilePtr=ptr;
    return retVal;
}
/*
* 从uncom.txt中读取内容,然后解压缩
*/
int main(int argc, char *argv[])
{
	const char *uncom_file_name = "uncom.txt";
	long lFileSize1 = 0;
	unsigned char * FilePtr = NULL;
	int err = 0;
	uLongf uncom_len = 1024;
	Bytef uncom_buf[1024];
	memset(uncom_buf,0x00,sizeof(uncom_buf));

	if(ReadFileMemory(uncom_file_name,&lFileSize1,&FilePtr)==0){
		printf("error reading %s\n",uncom_file_name);
		return 1;
	}else{
		printf("file %s read ,%d bytes\n",uncom_file_name,lFileSize1);
	}
	err = uncompress(uncom_buf,&uncom_len,FilePtr,lFileSize1);
	printf("uncom_len = %d\n",uncom_len);
	if (err != Z_OK)
	{
		printf("err = %d\n",err);
		return 1;
	}
	if(FilePtr != NULL)
	{
		free(FilePtr);
		FilePtr = NULL;
	}
	printf("uncom_buf = %s\n",uncom_buf);
	return 0;
}
  1. エラーにはいくつかの種類があります。最初のタイプの解凍について説明します。uncom_lenの2番目のパラメーターは0として定義されています。このパラメーターは解凍後のデータよりも大きいため、最初にこの値の値を見積もる必要があります。これ0として定義されます。エラーはZ_DATA_ERRORです。
  2. 2番目のエラーは、2番目のパラメーターの定義が小さすぎることです。たとえば、最初にサイズを512と定義しましたが、これは偶然です。解凍したデータで、最終的に513のサイズが見つかりました。ここでの定義が小さすぎると、エラーはZ_BUF_ERRORとして報告されます。もちろん、インターネット上で変数定義のタイプが正しくない場合、このエラーが報告されます。私は試していません。
  3. 3番目のタイプのエラーは、実行時のクラッシュです。スタック情報を確認してください。エラーはinflate_fastで報告されます。アセンブリで、この兄弟のzlib uncompressメソッドを試して、データを解凍しました。inflate_fast関数の解決策は実行可能です。対応するアセンブリ関数の名前を変更する場合は、完全に変更する必要があることに注意してください。変更後、contrib \ masmx86の下にあるinffas32.lstとinffas32.objを手動で削除する必要があります。ソリューションをクリックして再生成します。 。
  4. 以下は私が抽出したデータです

q
1 0 0 1 50 700 cm
BT
/F0 24 Tf
0 0 Td
[(   )20(     )]TJ
ET
Q
q
BT
/F0 24 Tf
0 TL
50 676 Td
(  	 \n    \r      \r    	   	     \r      )Tj
0 -24 Td
(           	   \n   \r  	     	   \n          )Tj
0 -24 Td
(       \r \n  \n              	   \n 	     )Tj
0 -24 Td
[( \r         	    )20(           \n     \r   )]TJ
0 -24 Td
[( \r        \r  )20( \n    )20(  	    )]TJ
ET
Q

ご不明な点がございましたら、メッセージを残してください

おすすめ

転載: blog.csdn.net/yangkunhenry/article/details/103390780