首先关于转码的流程:
视频文件 ——> 解封装 ——> 解码 ——> 编码 ——> 封装 ——> 转码后的视频文件
那么转换到 MediaCodec 中对应的流程即:
视频
MediaExtractor 解封装 video 数据,
MediaCodec 解码器解码压缩视频数据,并输入到 Surface
Surface 中的原始视频数据输入到 MediaCodec 编码器进行编码
对编码器输出数据进行封装(不分块的情况下:使用 MediaMuxer 进行封装。 分块的情况下:使用 FFmpeg muxer 进行封装)
音频
MediaExtractor 解封装 audio 数据,
MediaCodec 解码器解码压缩视频数据
解码后的 ByteBuffer 数据输入 MediaCodec 编码器进行编码
对编码器输出数据进行封装(不分块的情况下:使用 MediaMuxer 进行封装。 分块的情况下:使用 FFmpeg muxer 进行封装)
先简单介绍下前面流程中提到的 MediaExtractor & MediaMuxer
MediaExtractor
主要用于提取音视频相关信息,分离音视频。读取音视频文件,然后按照一定的格式输出出来。
使用步骤(参考官方示例):
MediaExtractor extractor = new MediaExtractor();// 设置数据源extractor.setDataSource(...);// 文件轨道总数int numTracks = extractor.getTrackCount();for (int i = 0; i < numTracks; ++i) { MediaFormat format = extractor.getTrackFormat(i); String mime = format.getString(MediaFormat.KEY_MIME); if (weAreInterestedInThisTrack) { // 因为 MediaExtractor 需要选定轨道之后,才能读取数据。所以针对 video & audio 如果想要同步处理的话,则需要创建两个MediaExtractor分别读取 extractor.selectTrack(i); } }// 读取数据到 inputBuffer ByteBuffer inputBuffer = ByteBuffer.allocate(...)while (extractor.readSampleData(inputBuffer, ...) != 0) { // 数据对应索引 int trackIndex = extractor.getSampleTrackIndex(); // 数据时间戳 long presentationTimeUs = extractor.getSampleTime(); ... // 前进到下一帧(不存在下一帧,则返回 false) extractor.advance(); }// 释放extractor.release(); extractor = null;
MediaMuxer
主要用于封装编码后的视频流和音频流到文件容器中(目前支持 MP4、Webm、3GP文件封装格式)
使用步骤:
// 创建 MP4 封装格式的封装器MediaMuxer muxer = new MediaMuxer("temp.mp4", OutputFormat.MUXER_OUTPUT_MPEG_4);// More often, the MediaFormat will be retrieved from MediaCodec.getOutputFormat()// or MediaExtractor.getTrackFormat().MediaFormat audioFormat = new MediaFormat(...); MediaFormat videoFormat = new MediaFormat(...);int audioTrackIndex = muxer.addTrack(audioFormat);int videoTrackIndex = muxer.addTrack(videoFormat); ByteBuffer inputBuffer = ByteBuffer.allocate(bufferSize);boolean finished = false; BufferInfo bufferInfo = new BufferInfo(); muxer.start();while(!finished) { // getInputBuffer() will fill the inputBuffer with one frame of encoded // sample from either MediaCodec or MediaExtractor, set isAudioSample to // true when the sample is audio data, set up all the fields of bufferInfo, // and return true if there are no more samples. finished = getInputBuffer(inputBuffer, isAudioSample, bufferInfo); if (!finished) { int currentTrackIndex = isAudioSample ? audioTrackIndex : videoTrackIndex; // 写入文件 muxer.writeSampleData(currentTrackIndex, inputBuffer, bufferInfo); } }; muxer.stop(); muxer.release();
使用 Surface 作为解码的输出以及编码的输入
MediaCodec 通过 Surface 可以实现编解码的硬件加速。
编码器通过调用 createInputSurface() 方法获取一个 Surface 作为 encoder的输入。
解码器在 调用 configure() 方法时传入 Surface 参数,解码后的数据直接输出到 Surface。
前面简单介绍了 MediaCodec 的大致流程,下面展开具体介绍:
MediaCodec 转码流程.png
MediaCodec 选择异步方式,前面的文章已经介绍过异步方式下如何调用,主要是四个方法:
public void onInputBufferAvailable(); // codec 存在可用输入缓冲区,将需要处理的数据输入缓冲区public void onOutputBufferAvailable();// codec 存在可用输出缓冲,取出完成编解码的数据进行下一步处理public void onError(); // 编解码出错public void onOutputFormatChanged(); // 输出的 MediaFormat 发生了改变
参考着上面的流程图,介绍下每个主要的步骤
视频:
创建 MediaExtractor, 用于获取输入视频的 MediaFormat 以及 读取视频压缩数据
配置视频输出相关参数(码率、宽&高、帧率等)MediaFormat, 创建 video 编码器,并获取 encoder 的输入 Surface
通过 MediaExtractor 获取输入视频的 MediaFormat, 创建 video 解码器,并在 configure 时传入 Surface 作为输出目标
当 decoder 存在可用输入缓冲时,通过 MediaExtractor 读取 video 压缩数据,传入 decoder 进行处理(queueInputBuffer)
当 decoder 存在可用输出缓冲时,调用 releaseOutputBuffer(index, true) 将数据输出到 Surface,
encoder 存在可用输入缓冲时,会直接从 Surface 获取数据(这部分会自动处理,不用做额外工作)
encoder 存在可用输出缓冲时,getOutputBuffer(index) 获取 video 压缩数据,进行封装
音频:
创建 MediaExtractor, 用于获取输入音频的 MediaFormat 以及 读取音频压缩数据
配置音频输出相关参数(采样率、比特率、信道数量等)MediaFormat, 创建 audio 编码器
通过 MediaExtractor 获取输入音频的 MediaFormat, 创建 audio 解码器
当 decoder 存在可用输入缓冲时,通过 MediaExtractor 读取 audio 压缩数据,传入 decoder 进行处理(queueInputBuffer)
当 decoder 存在可用输出缓冲时,getOutputBuffer(index) 获取音频原始数据,并存入本地缓存
encoder 存在可用输入缓冲时,将本地缓存中的音频原始数据 queInputBuffer 输入编码器
encoder 存在可用输出缓冲时,getOutputBuffer(index) 获取 audio 压缩数据,进行封装
Tips:
转码中存在视频截取的场景,MediaCodec 中没有类似 FFmpeg 中 "-ss、-t" 可以控制截取起点和时长的参数,所以需要在向解码器输入参数时人为进行截取:
// seek 到指定时间(mode - 指定时间的前一帧、后一帧、最靠近的一帧)public native void seekTo(long timeUs, @SeekMode int mode);
首先: 调用 MediaExtractor.seekTo 方法 seek 到视频截取开始时间
然后: 在向解码器中传输压缩数据时,判断是否处理了足够时长的数据,下面直接通过代码来看:
while (!mVideoReadDone) { // 读取视频数据到解码器输入缓冲 int size = mVideoExtractor.readSampleData(decoderInputBuffer, 0); long pst = mVideoExtractor.getSampleTime(); // 判断当前帧的时间戳是否已经超过要截取的时长 if (length != 0 && pst > start + length) { // 到达剪辑时间 mVideoReadDone = true; } else { if (start > 0) { // 如果需要截取视频,需要重新计算时间戳(因为当前帧记录的还是截取之前的时间戳) videoPst += videoSampleTime; pst = videoPst; } if (size >= 0) { // 将解码器缓冲送入解码器 codec.queueInputBuffer(index, 0, size, pst, mVideoExtractor.getSampleFlags()); } // 视频数据是否已读取完 mVideoReadDone = !mVideoExtractor.advance(); } if (mVideoReadDone) { // 视频数据读完 或 到达剪辑时间 logdw(LOG_LEVEL_DEBUG, "Video extractor: EOS"); // send EOS to decoder codec.queueInputBuffer(index, 0, 0, 0, MediaCodec.BUFFER_FLAG_END_OF_STREAM); } if (size >= 0) { break; } }
视频封装:
MediaMuxer:
在使用 MediaMuxer 进行音视频封装时需要注意:需要先添加 video & audio track,然后才能向 muxer 写入压缩数据。
public abstract void onOutputFormatChanged( @NonNull MediaCodec codec, @NonNull MediaFormat format);
在编码器输出数据之前,会先输出压缩数据的 MediaFormat,因此要在 video & audio 编码器都输出 OutputFormat 之后,并添加到 MeidaMuxer 之后,再调用 start 方法启动 Muxer:
// 记录下 video & audio 的track,后面写入数据时需要用到mOutputVideoTrack = mMuxer.addTrack(mEncoderVideoFormat); mOutputAudioTrack = mMuxer.addTrack(mEncoderAudioFormat); mMuxer.start();
当编码器输出压缩数据后:
public void onOutputBufferAvailable(MediaCodec codec, int index, MediaCodec.BufferInfo info)
就可以将 video & audio 压缩数据写入 MediaMuxer 进行封装:
// video ByteBuffer videoOutputBuffer = mVideoEncoder.getOutputBuffer(index); mMuxer.writeSampleData(mOutputVideoTrack, videoOutputBuffer, info);// audioByteBuffer audioOutputBuffer = mAudioEncoder.getOutputBuffer(index); mMuxer.writeSampleData(mOutputAudioTrack, audioOutputBuffer, info);
FFmpeg: 关于使用 FFmpeg muxer 封装 MediaCodec 压缩数据在另外一篇文章中单独介绍。
作者:GeorgeMR
链接:https://www.jianshu.com/p/65b85dfdeaae
共同学习,写下你的评论
评论加载中...
作者其他优质文章