抖音直播间弹幕protocbuf分析

免责任声明:
任何可操作性的内容与本文无关,文章内容仅供参考学习,如有侵权, 损害贵公司利益,
请联系作者,会立刻马上进行删除

分析下:

  1. 1.protocolbuffer(以下简称PB)是google 的一种数据交换的格式,它独立于语言,独立于平台。
  2. protobuf是新型通信协议, 在抖音里的私信也是走的pro协议实现的。
  3. 解析pro协议的数据包需要反序列化才可以解析。

一、protobuf正向流程

1.创建proto文件生成对应的py文件

pycharm有编辑proto的插件,写代码有提示很方便,创建protobuf文件包,创建addressbook.proto文件

syntax = "proto3";

message AddressBook {
    
    
  repeated Person people = 1;
}

message Person {
    
    
  string name = 1;
  int32 id = 2;
  string email = 3;
  float money = 4;
  bool work_status = 5;

  repeated PhoneNumber phones = 6;
  MyMessage maps = 7;

}

message PhoneNumber {
    
    
    string number = 1;
    PhoneType type = 2;
}

message MyMessage {
    
    
  map<int32, int32> mapfield = 1;
}

进入这个文件的目录

protoc ./addressbook.proto  --python_out=./

在这里插入图片描述
创建add_person.py

# 环境python3.8
from protobuf import addressbook_pb2
from google.protobuf import json_format

# 添加数据信息
address_book = addressbook_pb2.AddressBook()
person = address_book.people.add()

person.id = 1
person.name = "safly"
person.email = "[email protected]"
person.money = 1000.11
person.work_status = True

phone_number = person.phones.add()
phone_number.number = "123456"
phone_number.type = addressbook_pb2.HOME

maps = person.maps
maps.mapfield[1] = 1
maps.mapfield[2] = 2

# 转成字符串
serializeToString = address_book.SerializeToString()
print(serializeToString)

# a = address_book.ParseFromString(serializeToString)
# print(type(address_book.people))

# 转成json
b = json_format.MessageToJson(address_book)
print(b)

文章转载于: https://blog.csdn.net/weixin_49572581/article/details/118731675

二、protobuf逆向流程

1.抓包确定位置
通过charles抓包
在这里插入图片描述
那就已经接口是aweme/v2/feed,打开jadx打开app全局搜索关键词,按住ctrl点击这个类
在这里插入图片描述
点进去就找对应的字段和编号啦
在这里插入图片描述

2.根据代码编写相应的proto文件

syntax = "proto3";
// 这里还需要其他的proto文件,数据很多,jadx代码上都有,安装ctrl点进去就是,以此类推
import 'myAwemeStructV2.proto';
import 'myExtraStructV2.proto';
import 'myLogPbStructV2.proto';
import 'myGuideWordV2.proto';

message AwemeV2FeedResponse {
    
    
    int32 status_code = 1;
    int64 min_cursor = 2;
    int64 max_cursor = 3;
    int32 has_more = 4;
    repeated my_aweme_struct_v2.AwemeStructV2 aweme_list = 5;
    string rid = 6;
    int32 home_model = 7;
    int32 refresh_clear = 8;
    repeated my_extra_struct_v2.ExtraStructV2 extra = 9;
    repeated my_log_pb_structV2.LogPbStructV2 log_pb = 10;
    string DebugInfo = 11;
    repeated my_guide_word_v2.GuideWordV2 guide_word = 12;
    repeated my_aweme_struct_v2.AwemeStructV2 preload_ads = 13;
    string status_msg = 14;
    int32 block_code = 15;
    repeated my_aweme_struct_v2.AwemeStructV2 preload_awemes = 16;
    bool enable_re_rank = 17;
    bool disable_adjust_for_cache = 18;
}

3.结果

生成相应的py文件,最后结合抓取的信息转换成json格式示例代码

# 环境python2.7
info = DouyinAwemeFeed_pb2.AwemeV2FeedResponse()
info.ParseFromString("你的请求proto数据")
print json.dumps(MessageToDict(info, preserving_proto_field_name=True), ensure_ascii=False)

然后让我们看下最后的效果,最后抖音直播间实时弹幕信息就这样获取到了。
在这里插入图片描述有热爱技术的小伙伴们(扣扣: 519545433)可以一起交流进步啊

猜你喜欢

转载自blog.csdn.net/weixin_38819889/article/details/121050835