FFMpeg 库中比较重要的函数以及数据结构Word文件下载.docx

资源描述

FFMpeg 库中比较重要的函数以及数据结构Word文件下载.docx

《FFMpeg 库中比较重要的函数以及数据结构Word文件下载.docx》由会员分享，可在线阅读，更多相关《FFMpeg 库中比较重要的函数以及数据结构Word文件下载.docx（27页珍藏版）》请在冰点文库上搜索。

FFMpeg 库中比较重要的函数以及数据结构Word文件下载.docx

在此之前还是先谈一下

ffmpeg的编译问题。

在linux下的编译比较简单，这里不多说了。

在windows下的编译可以参考以下网页：

http:

//bbs.chinavideo.org/viewthread.php?

tid=1897&

extra=page%3D1

值得一提的是，在使用编译后的sdk进行测试时（用到ffmpeg目录下的output_example.c）编译过程中可能会有以下两个问

题：

1．Output_example.c用到了snprintf.h这个头文件。

然而这个头文件在win下和linux下有所不同。

具体在win下

可以用以下方法解决：

//www.ijs.si/software/snprintf/

2．如果使用vc6，或是vc6的命令行进行编译，inline可能不认。

错误会出现在common.h文件中，可以在common.h中加入

#ifdef_MSC_VAR

#defineinline__inline

#endif

交待完毕进入正题。

一．FFMpeg中的数据结构：

I.AVFormatContext

一般在使用ffmpegsdk的代码中AVFormatContext是一个贯穿始终的数据结构，很多函数都要用到它作为参数。

FFmpeg代码

中对这个数据结构的注释是：

formatI/Ocontext

此结构包含了一个视频流的格式内容。

其中存有了AVInputFormat（orAVOutputFormat同一时间AVFormatContext内只能存

在其中一个），和AVStream、AVPacket这几个重要的数据结构以及一些其他的相关信息，比如title,author,copyright等。

还有一些可能在编解码中会用到的信息，诸如：

duration,file_size,bit_rate等。

参考avformat.h头文件。

Useage:

声明：

AVFormatContext*oc;

（1）

初始化：

由于AVFormatConext结构包含许多信息因此初始化过程是分步完成，而且有些变量如果没有值可用，也可不初始

化。

但是由于一般声明都是用指针因此一个分配内存过程不可少：

oc=av_alloc_format_context（）;

（2）

结构中的AVInputFormat*（或AVOutputFormat*）是一定要初始化的，基本上这是编译码要使用什么codec的依据所在：

oc->

oformat=fmt;

oroc->

iformat=fmt;

（3）

其中AVOutputFormat*fmt或AVInputFormat*fmt。

（AVInputFormatandAVOutputFormat的初始化在后面介绍。

随后在参

考代码output_example.c中有一行：

snprintf（oc-filename,sizeof（oc->

filename）,“%s”,filename）;

（4）

还不是十分清楚有什么作用，估计是先要在输出文件中写一些头信息。

在完成以上步骤後，（初始化完毕AVInputFormat*（或AVOutputFormat*）以及AVFormatContext）接下来就是要利用oc初始

化本节开始讲到的AVFormatContext中的第二个重要结构。

AVStream（假设已经有了声明AVStream*video_st。

参考代码中

用了一个函数来完成初始化，当然也可以在主函数中做，传递进函数的参数是oc和fmt->

video_codec（这个在下一节介绍

（29））：

vdeo_st=add_video_stream（oc,fmt->

video_codec）;

（5）

此函数会在后面讲到AVStream结构时分析。

AVFormatContext最后的一个设置工作是：

if（av_set_paramters（oc,NULL）<

0）{（6）

//handleerror;

}

dump_format（oc,0,filename,1）;

（7）

作用就是看看先前的初始化过程中设置的参数是否符合规范，否则将报错。

上面讲的都是初始化的过程，包括AVFormatContext本身的和利用AVFormatContext初始化其他数据结构的。

接下来要讲讲整

个的编解码过程。

我想先将ouput_example.c中main函数内的编解码函数框架描述一下。

这样比较清晰，而且编码者为了结

构清晰，在写ouput_example.c的过程中也基本上在main函数中只保持AVFormatContext和AVStream两个数据结构

（AVOutputFormat其实也在但是包含在AVFormatContext中了）。

//openvideocodecandallocatethenecessaryencodebuffers

if（video_st）

open_video（oc,video_st）;

（8）

//writethestreamheader,ifany

av_write_header（oc）;

（9）

//encodeanddecodeprocess

for（;

;

）{

write_video_frame（oc,video_st）;

（10）

//breakcondition…here

//closecodec

close_video（oc,video_st）;

（11）

//writethetrailer,ifany

av_write_trailer（oc）;

（12）

//freethestreams

for（i=0;

b_streams;

i++）{

av_freep（&

streams[i]->

codec）;

（13）

streams[i]）;

（14）

//closetheouputfile

if（!

（fmt->

flags&

AVFMT_NOFILE））{

url_fclose（&

pb）;

（15）

av_free（oc）;

（16）

通过以上的一串代码，就可以清晰地看出AVFormatContex*oc和AVStream*video_st是在使用ffmpegSDK开发时贯穿始终的

两个数据结构。

以下，简要介绍一下三个标为红色的函数，他们是参考代码output_example.c开发者自行定义的函数。

这样

可以使整个代码结构清晰，当然你在使用ffmpegSDK时也可以在主函数中完成对应的功能。

在后面我们会专门针对这三个函

数做分析。

1.open_video（oc,video_st）;

此函数主要是对视频编码器（或解码器）的初始化过程。

初始化的数据结构为AVCodec*codec和AVCodecContext*c包括用

到了的SDK函数有：

c=st->

codec;

codec=avcodec_find_encoder（c->

codec_id）;

//编码时，找编码器（17）

codec=avcodec_find_decoder（c->

//解码时，找解码器（18）

AVCodecContex是结构AVStream中的一个数据结构，因此在AVStream初始化後（5）直接复值给c。

//internalopenvideocodec

avcodec_open（c,codec）;

（19）

//allocatevideostreambuffer

//AVFrame*picture

//uint8_t*video_outbuf

video_outbuf_size=200000;

video_outbuf=av_maloc（video_outbuf_size）;

（20）

//allocatevideoframebuffer

picture=alloc_picture（c->

pix_fmt,c->

width,c->

height）;

（21）

上述三步比较容易理解，打开视频编解码codec、分配输出流缓存大小、分配每一帧图像缓存大小。

其中AVFrame也是ffmpeg

中主要数据结构之一。

这一步（8）是对编解码器的初始化过程。

2.write_video_frame（AVFormatContext*oc,AVStream*st）

这个函数中做了真正的编解码工作，其中的函数比较复杂先列出来慢慢分析。

用到的数据结构有AVCodecContext*c,SwsContext*img_convert_ctx。

其中SwsContext是用来变换图像格式的。

比如

yuv422变到yuv420等，当然也用到函数，见下面列表。

fill_yuv_image（tmp_picture,frame_count,c->

（22）

sws_scale（img_convert_ctx,tmp_picture->

tmp_picture->

linesize,

0,c->

height,picture->

data,picture->

linesize）;

（23）

img_convert_ctx=sws_getContxt（c->

height,PIX_FMT_YUV420P,（24）

c->

heigth,c->

pix_fmt,sws_flags,NULL,NULL,NULL）;

由于参考代码中做的是一个编码。

因此，它总是要求编码器输入的是yuv文件，而且是yuv420格式的。

就会有了以上一些处

理过程。

接下来调用编码器编码，数据规则化（打包）用到AVPacket，这也是ffmpeg中一个比较不好理解的地方。

out_size=avcodec_encode_video（c,video_outbuf,video_outbuf_size,picture）;

（25）

AVPacketpkt;

av_init_packet（&

pkt）;

（26）

//……handlepktprocess,wewillanalyzelater

ret=av_write_frame（oc,&

（27）

有encode就一定会有decode。

而且ffmpeg专为解码而生，但是为什么在参考代码中只用了encoder呢？

个人猜想是因为

encode只是用yuv420来编码，这样的yuv420生成比较容易，要是用到解码的化，还要在代码中附带一个其他格式的音视频文

件。

在源代码libavcodec文件夹中有一个apiexample.c的参考代码，其中就做了编解码。

有空的化我会分析一下。

3.close_video（AVFormatContext*oc,AVStream*st）

avcodec_close（st->

av_free（picture->

data[0]）;

av_free（picture）;

av_free（video_outbuf）;

比较容易理解，不多说了。

以上一大段虽然名为介绍AVFormatContext。

但基本上把ouput_example.c的视频编码部分的框架走了一遍，其一是想说明结

构AVFormatContext的重要性，另一方面也是希望对使用FFMpegSDK开发者有一个大致的框架。

其实，真正的一些编码函数，内存分配函数在SDK中都已经封装好了，只要搞清楚结构就能用了。

而开发者要做的就是一些

初始化的过程，基本上就是针对数据结构1的初始化。

II.AVOutputFormat

虽然简单（初始化）但是十分重要，他是编解码器将要使用哪个codec的“指示”。

在其成员数据中最重要的就是关于视频

codec的了：

enumCodecIDvideo_codec;

AVOutputFormat*fmt;

fmt=guess_format（NULL,filename,NULL）;

（28）

根据filename来判断文件格式，同时也初始化了用什么编码器。

当然，如果是用AVInputFormat*fmt的化，就是fix用什么

解码器。

（指定输出序列->

fix编码器，指定输入序列->

fix解码器？

）

III.AVStream

AVStream作为继AVFormatContext後第二个贯穿始终的结构是有其理由的。

他的成员数据中有AVCodecContext这基本的上是

对所使用的VideoCodec的参数进行设定的（包括bitrate、分辨率等重要信息）。

同时作为“Stream”，它包含了“流”

这个概念中的一些数据，比如：

帧率（r_frame_rate）、基本时间计量单位（time_base）、（需要编解码的）首帧位置

（start_time）、持续时间（duration）、帧数（nb_frames）以及一些ip信息。

当然后面的这些信息中有些不是必须要初

始化的，但是AVCodecContex是一定要初始化的，而且就是作为初始化AVStream最重要的一个部分。

我们在前面就谈到了

AVStream的初始化函数（5），现在来看看他是怎么做的：

//declaration

AVStream*video_st;

video_st=add_video_stream（oc,fmt->

staticAVStream*add_video_stream（AVFormatContex*oc,intcodec_id）{（29）

AVCodecContext*c;

//memberofAVStream,whichwillbeinitializedhere

AVStream*st;

//temporarydata,willbereturned

st=av_new_stream（oc,0）;

（30）

//以下基本是针对c的初始化过程。

包括比特率、分辨率、GOP大小等。

……

//以下的两行需要注意一下，特别是使用MP4的

strcmp（oc->

oformat->

name,“mp4”）||!

name,“mov”）||!

name,

“3gp”））

flags|=CODEC_FLAG_GLOBAL_HEADER;

//将st传给video_st;

returnst;

以上代码中，有几点需要注意的。

一个是（30）和c=st->

codec是一定要做的，当然这是编程中最基本的问题，（30）是将st

这个AVSteam绑定到AVFormatContext*oc上。

后面的c=st->

codec是将c绑定到st的AVCodecContext上。

其二是对c的初始

化过程中，ouput_example.c里做的是一些基本的配置，当然作为使用者的你还希望对codec加入其他的一些编解码的条件。

可以参考avcodec.h里关于AVCodecContext结构的介绍，注释比较详细的。

关于AVStream的使用在前面介绍AVFormatContext时已有所涉及，在主函数中三个编解码函数中（8）、（10）和（11）中。

观察相

关的代码，可以发现主要还是将AVStream中的AVCodecContext提取出来，再从中提取出AVCodec结构如在（8）中：

//open_video（oc,video_st）;

//AVFormatContext*oc,AVStream*st

AVCodec*codec;

（31）

//openthecodec

avcodec_open（c,codec）;

（32）

同样，我们可以看到在（10）（write_video_frame（））中AVFrame也是做为传递AVCodecContext结构的载体而存在。

（11）

（close_video（））比较简单，不熬述。

IV.AVCodecContext

此结构在FfmpegSDK中的注释是：

mainexternalapistructure其重要性可见一斑。

而且在avcodec它的定义处，对其每个

成员变量，都给出了十分详细的介绍。

应该说AVCodecContext的初始化是Codec使用中最重要的一环。

虽然在前面的

AVStream中已经有所提及，但是这里还是要在说一遍。

AVCodecContext作为Avstream的一个成员结构，必须要在Avstream初

始化後（30）再对其初始化（AVStream的初始化用到AVFormatContex）。

虽然成员变量比较多，但是这里只说一下在

output_example.c中用到了，其他的请查阅avcodec.h文件中介绍。

//staticAVStream*add_video_stream（AVFormatContext*oc,intcodec_id）

codec_id=codec_id;

codec_type=CODEC_TYPE_VIDEO;

bit_rate=400000;

//400kbits/s

width=352;

height=288;

//CIF

//帧率做分母，秒做分子，那么time_base也就是一帧所用时间。

（时间基！

time_base.den=STREAM_FRAME_RATE;

time_base.num=1;

gop_size=12;

//heredefine:

//#defineSTREAM_PIX_FMTPIX_FMT_YUV420P

//pixelformat,seePIX_FMT_xxx

//-encoding:

setbyuser.

//-decoding:

setbylavc.

pix_fmt=STREAM_PIX_FMT;

除了以上列出了的。

还有诸如指定运动估计算法的:

me_method。

量化参数、最大b帧数：

max_b_frames。

码率控制的参数、

差错掩盖error_concealment、模式判断模式：

mb_decision（这个参数蛮有意思的，可以看看avcodec.h1566行）、

Lagrangemultipler参数：

lmin&

lmax和宏块级Lagrangemultipler参数：

mb_lmin&

mb_lmax、constant

quantizationparameterratecontrolmethod:

cqp等。

值得一提的是在AVCodecContext中有两个成员数据结构：

AVCodec、AVFrame。

AVCodec记录了所要使用的Codec信息并且含有

5个函数：

init、encoder、close、decode、flush来完成编解码工作（参见avcode.h2072行）。

AVFrame中主要是包含了编

码後的帧信息，包括本帧是否是keyframe、*data[4]定义的Y、Cb和Cr信息等，随后详细介绍。

初始化後，可以说AVCodecContext在（8）&

（10）中大显身手。

先在（8）open_video（）中初始化AVCodec*codec以及AVFrame*

picture：

//AVCodecContext*c;

picture=alloc_picture（PIX_FMT_YUV420P,c->

後在writer_video_frame（AVFormatContext*oc,AVStream*st）中作为一个编解码器的主要参数被利用：

V．AVCodec

结构AVCodec中成员变量和成员函数比较少，但是很重要。

他包含了CodecID，也就是用哪个Codec、

像素格式信息。

还有前面提到过的5个函数（init、encode、close、decoder、flush）。

顺便提一下，虽然在参考代码

output_example.c中的编码函数用的是avcodec_encode_video（），我怀疑在其中就是调用了AVCodec的encode函数，他们

传递的参数和返回值都是一致的，当然还没有得到确认，有兴趣可以看看ffmpeg源代码。

在参考代码中，AVCodec的初始化

展开阅读全文