web-dev-qa-db-ja.com

Samsung Galaxy S7(Camera2)でのYUV_420_888の解釈

(私が理解しているように)次のロジックを考慮して、YUV_420_888からビットマップへの変換を記述しました。

enter image description here

アプローチを要約すると、カーネルの座標xとyは、Y平面の非埋め込み部分のxとy(2d割り当て)と出力ビットマップのxとyの両方と一致します。ただし、UプレーンとVプレーンは、4ピクセルのカバレッジに1バイトを使用するため、Yプレーンとは構造が異なります。さらに、複数のPixelStrideがあり、さらにまた、Y平面とは異なるパディングがあります。したがって、カーネルによってUとVに効率的にアクセスするために、それらを1-d割り当てに入れ、与えられた(1-d​​割り当て内の対応するU-とVの位置を与えるインデックス「uvIndex」を作成しました( x、y)(パディングされていない)Y平面(および出力ビットマップ)の座標。

Rs-Kernelをリーンに保つために、LaunchOptionsを介してx範囲をキャップすることでyPlaneのパディング領域を除外しました(これはy平面のRowStrideを反映しているため、カーネル内で無視できます)。したがって、uvIndex内のuvPixelStrideとuvRowStride、つまりu値とv値にアクセスするために使用されるインデックスを考慮する必要があるだけです。

これは私のコードです:

Yuv420888.rsという名前のRenderscriptカーネル

  #pragma version(1)
  #pragma rs Java_package_name(com.xxxyyy.testcamera2);
  #pragma rs_fp_relaxed

  int32_t width;
  int32_t height;

  uint picWidth, uvPixelStride, uvRowStride ;
  rs_allocation ypsIn,uIn,vIn;

 // The LaunchOptions ensure that the Kernel does not enter the padding  zone of Y, so yRowStride can be ignored WITHIN the Kernel.
 uchar4 __attribute__((kernel)) doConvert(uint32_t x, uint32_t y) {

 // index for accessing the uIn's and vIn's
uint uvIndex=  uvPixelStride * (x/2) + uvRowStride*(y/2);

// get the y,u,v values
uchar yps= rsGetElementAt_uchar(ypsIn, x, y);
uchar u= rsGetElementAt_uchar(uIn, uvIndex);
uchar v= rsGetElementAt_uchar(vIn, uvIndex);

// calc argb
int4 argb;
    argb.r = yps + v * 1436 / 1024 - 179;
    argb.g =  yps -u * 46549 / 131072 + 44 -v * 93604 / 131072 + 91;
    argb.b = yps +u * 1814 / 1024 - 227;
    argb.a = 255;

uchar4 out = convert_uchar4(clamp(argb, 0, 255));
return out;
}

Java側:

    private Bitmap YUV_420_888_toRGB(Image image, int width, int height){
    // Get the three image planes
    Image.Plane[] planes = image.getPlanes();
    ByteBuffer buffer = planes[0].getBuffer();
    byte[] y = new byte[buffer.remaining()];
    buffer.get(y);

    buffer = planes[1].getBuffer();
    byte[] u = new byte[buffer.remaining()];
    buffer.get(u);

    buffer = planes[2].getBuffer();
    byte[] v = new byte[buffer.remaining()];
    buffer.get(v);

    // get the relevant RowStrides and PixelStrides
    // (we know from documentation that PixelStride is 1 for y)
    int yRowStride= planes[0].getRowStride();
    int uvRowStride= planes[1].getRowStride();  // we know from   documentation that RowStride is the same for u and v.
    int uvPixelStride= planes[1].getPixelStride();  // we know from   documentation that PixelStride is the same for u and v.


    // rs creation just for demo. Create rs just once in onCreate and use it again.
    RenderScript rs = RenderScript.create(this);
    //RenderScript rs = MainActivity.rs;
    ScriptC_yuv420888 mYuv420=new ScriptC_yuv420888 (rs);

    // Y,U,V are defined as global allocations, the out-Allocation is the Bitmap.
    // Note also that uAlloc and vAlloc are 1-dimensional while yAlloc is 2-dimensional.
    Type.Builder typeUcharY = new Type.Builder(rs, Element.U8(rs));
    typeUcharY.setX(yRowStride).setY(height);
    Allocation yAlloc = Allocation.createTyped(rs, typeUcharY.create());
    yAlloc.copyFrom(y);
    mYuv420.set_ypsIn(yAlloc);

    Type.Builder typeUcharUV = new Type.Builder(rs, Element.U8(rs));
    // note that the size of the u's and v's are as follows:
    //      (  (width/2)*PixelStride + padding  ) * (height/2)
    // =    (RowStride                          ) * (height/2)
    // but I noted that on the S7 it is 1 less...
    typeUcharUV.setX(u.length);
    Allocation uAlloc = Allocation.createTyped(rs, typeUcharUV.create());
    uAlloc.copyFrom(u);
    mYuv420.set_uIn(uAlloc);

    Allocation vAlloc = Allocation.createTyped(rs, typeUcharUV.create());
    vAlloc.copyFrom(v);
    mYuv420.set_vIn(vAlloc);

    // handover parameters
    mYuv420.set_picWidth(width);
    mYuv420.set_uvRowStride (uvRowStride);
    mYuv420.set_uvPixelStride (uvPixelStride);

    Bitmap outBitmap = Bitmap.createBitmap(width, height, Bitmap.Config.ARGB_8888);
    Allocation outAlloc = Allocation.createFromBitmap(rs, outBitmap, Allocation.MipmapControl.MIPMAP_NONE, Allocation.USAGE_SCRIPT);

    Script.LaunchOptions lo = new Script.LaunchOptions();
    lo.setX(0, width);  // by this we ignore the y’s padding zone, i.e. the right side of x between width and yRowStride
    lo.setY(0, height);

    mYuv420.forEach_doConvert(outAlloc,lo);
    outAlloc.copyTo(outBitmap);

    return outBitmap;
}

Nexus 7(API 22)でテストすると、Niceカラービットマップが返されます。ただし、このデバイスには自明なピクセルトライド(= 1)があり、パディングはありません(つまり、rowstride = width)。真新しいサムスンS7(API 23)でテストしています。緑色のものを除いて、色が正しくない写真が表示されます。しかし、画像は緑に対する一般的な偏りを示していません。緑以外の色が正しく再現されていないようです。 S7はu/vピクセルストライド2を適用し、パディングを適用しないことに注意してください。

最も重要なコード行はrs-code内にあるので、u/vプレーンのアクセスuint uvIndex =(...)誰かが解決策を見ていますか?ありがとう。

更新:私はすべてをチェックし、y、u、vのアクセスに関するコードが正しいことを確信しています。したがって、問題はuとvの値自体にあるはずです。緑以外の​​色は紫色の傾きを持ち、u、v値を見ると、約110〜150のかなり狭い範囲にあるようです。デバイス固有のYUV-> RBG変換に対応する必要がある可能性は本当にありますか?私は何かを逃しましたか?

更新2:Eddyのフィードバックのおかげで、コードが修正されました。

26
Settembrini

見る

floor((float) uvPixelStride*(x)/2)

y x座標からU、V行のオフセット(uv_row_offset)を計算します。

uvPixelStride = 2の場合、xが増加するにつれて:

x = 0, uv_row_offset = 0
x = 1, uv_row_offset = 1
x = 2, uv_row_offset = 2
x = 3, uv_row_offset = 3

これは正しくありません。 uvPixelStride = 2であるため、uv_row_offset = 1または3に有効なU/Vピクセル値はありません。

あなたが欲しい

uvPixelStride * floor(x/2)

(その場合、整数除算の重要な切り捨て動作を覚えていると自分が信頼していないと仮定します):

uvPixelStride * (x/2)

十分なはずです

これにより、マッピングは次のようになります。

x = 0, uv_row_offset = 0
x = 1, uv_row_offset = 0
x = 2, uv_row_offset = 2
x = 3, uv_row_offset = 2

色のエラーが修正されるかどうかを確認します。実際には、ここでの誤ったアドレス指定は、基になるYUVデータが半平面である可能性が高いため、他のすべてのカラーサンプルが誤ったカラープレーンからのものになることを意味します(したがって、UプレーンはVプレーン+ 1バイトで始まり、2つのプレーンがインターリーブされます)。

7
Eddy Talvala

エラーが発生した場合

_Android.support.v8.renderscript.RSIllegalArgumentException: Array too small for allocation type
_

buffer.capacity()の代わりにbuffer.remaining()を使用します

また、画像に対して既にいくつかの操作を行っている場合は、バッファでrewind()メソッドを呼び出す必要があります。

5
Lolo

さらに、他の誰かが

Android.support.v8.renderscript.RSIllegalArgumentException:割り当てタイプに対して配列が小さすぎます

yAlloc.copyFrom(y);yAlloc.copy1DRangeFrom(0, y.length, y);に変更して修正しました

4
user2486946

このコードでは、RenderScript互換ライブラリ(Android.support.v8.renderscript。*)を使用する必要があります。

Android API 23で動作するように互換性ライブラリを取得するために、Miao Wangの回答に従ってGradle-plugin 2.1.0およびBuild-Tools 23.0.3に更新しました How Android StudioでRenderscriptスクリプトを作成し、実行させるには?

彼の回答に従って、「Gradleバージョン2.10が必要です」というエラーが表示された場合は、変更しないでください。

classpath 'com.Android.tools.build:gradle:2.1.0'

代わりに、Project\gradle\wrapper\gradle-wrapper.propertiesファイルのdistributionUrlフィールドを次のように更新します

distributionUrl=https\://services.gradle.org/distributions/gradle-2.10-all.Zip

そしてFile> Settings> Builds、Execution、Deployment> Build Tools> Gradle> GradletoUse default gradle wrapper に従って "Gradleバージョン2.10が必要です。"エラー

1
Nick

サムスンギャラクシータブ5(タブレット)では、Androidバージョン5.1.1(22)、YUV_420_888形式と主張されている)、次のrenderscript数学が適切に機能し、正しい色が生成されます。

uchar yValue    = rsGetElementAt_uchar(gCurrentFrame, x + y * yRowStride);
uchar vValue    = rsGetElementAt_uchar(gCurrentFrame, ( (x/2) + (y/4) * yRowStride ) + (xSize * ySize) );
uchar uValue    = rsGetElementAt_uchar(gCurrentFrame, ( (x/2) + (y/4) * yRowStride ) + (xSize * ySize) + (xSize * ySize) / 4);

水平方向の値(つまり、y)が2ではなく4倍にスケーリングされる理由がわかりませんが、うまく機能します。また、rsGetElementAtYuv_uchar_Y | U | Vの使用を避ける必要もありました。関連する割り当てストライド値は、適切なものではなくゼロに設定されていると思います。 rsGetElementAt_uchar()の使用は、適切な回避策です。

Samsung Galaxy S5(スマートフォン)では、Androidバージョン5.0(21)、YUV_420_888の形式が疑われる場合、uとvの値を回復できません。すべてゼロとして渡されます。これにより、緑色に見える画像。発光は問題ありませんが、画像が垂直に反転しています。

1
Steven Punte

YUV-> BGRを変換する完全なソリューションを投稿し(他のフォーマットにも適用できます)、レンダースクリプトを使用して画像を直立させます。割り当ては入力として使用され、バイト配列は出力として使用されます。 Android 8+でSamsungデバイスも含めて)テストされています。

Java

/**
 * Renderscript-based process to convert YUV_420_888 to BGR_888 and rotation to upright.
 */
public class ImageProcessor {

    protected final String TAG = this.getClass().getSimpleName();

    private Allocation mInputAllocation;
    private Allocation mOutAllocLand;
    private Allocation mOutAllocPort;

    private Handler mProcessingHandler;
    private ScriptC_yuv_bgr mConvertScript;
    private byte[] frameBGR;

    public ProcessingTask mTask;
    private ImageListener listener;
    private Supplier<Integer> rotation;

    public ImageProcessor(RenderScript rs, Size dimensions, ImageListener listener, Supplier<Integer> rotation) {

        this.listener = listener;
        this.rotation = rotation;
        int w = dimensions.getWidth();
        int h = dimensions.getHeight();

        Type.Builder yuvTypeBuilder = new Type.Builder(rs, Element.YUV(rs));
        yuvTypeBuilder.setX(w);
        yuvTypeBuilder.setY(h);
        yuvTypeBuilder.setYuvFormat(ImageFormat.YUV_420_888);
        mInputAllocation = Allocation.createTyped(rs, yuvTypeBuilder.create(),
                Allocation.USAGE_IO_INPUT | Allocation.USAGE_SCRIPT);

        //keep 2 allocations to handle different image rotations
        mOutAllocLand = createOutBGRAlloc(rs, w, h);
        mOutAllocPort = createOutBGRAlloc(rs, h, w);

        frameBGR = new byte[w*h*3];

        HandlerThread processingThread = new HandlerThread(this.getClass().getSimpleName());
        processingThread.start();
        mProcessingHandler = new Handler(processingThread.getLooper());

        mConvertScript = new ScriptC_yuv_bgr(rs);
        mConvertScript.set_inWidth(w);
        mConvertScript.set_inHeight(h);

        mTask = new ProcessingTask(mInputAllocation);
    }

    private Allocation createOutBGRAlloc(RenderScript rs, int width, int height) {
        //Stored as Vec4, it's impossible to store as Vec3, buffer size will be for Vec4 anyway
        //using RGB_888 as alternative for BGR_888, can be just U8_3 type
        Type.Builder rgbTypeBuilderPort = new Type.Builder(rs, Element.RGB_888(rs));
        rgbTypeBuilderPort.setX(width);
        rgbTypeBuilderPort.setY(height);
        Allocation allocation = Allocation.createTyped(
            rs, rgbTypeBuilderPort.create(), Allocation.USAGE_SCRIPT
        );
        //Use auto-padding to be able to copy to x*h*3 bytes array
        allocation.setAutoPadding(true);

        return allocation;
    }

    public Surface getInputSurface() {
        return mInputAllocation.getSurface();
    }

    /**
     * Simple class to keep track of incoming frame count,
     * and to process the newest one in the processing thread
     */
    class ProcessingTask implements Runnable, Allocation.OnBufferAvailableListener {

        private int mPendingFrames = 0;

        private Allocation mInputAllocation;

        public ProcessingTask(Allocation input) {
            mInputAllocation = input;
            mInputAllocation.setOnBufferAvailableListener(this);
        }

        @Override
        public void onBufferAvailable(Allocation a) {
            synchronized(this) {
                mPendingFrames++;
                mProcessingHandler.post(this);
            }
        }

        @Override
        public void run() {
            // Find out how many frames have arrived
            int pendingFrames;
            synchronized(this) {
                pendingFrames = mPendingFrames;
                mPendingFrames = 0;

                // Discard extra messages in case processing is slower than frame rate
                mProcessingHandler.removeCallbacks(this);
            }

            // Get to newest input
            for (int i = 0; i < pendingFrames; i++) {
                mInputAllocation.ioReceive();
            }

            int rot = rotation.get();

            mConvertScript.set_currentYUVFrame(mInputAllocation);
            mConvertScript.set_rotation(rot);

            Allocation allocOut = rot==90 || rot== 270 ? mOutAllocPort : mOutAllocLand;

            // Run processing
            // ain allocation isn't really used, global frame param is used to get data from
            mConvertScript.forEach_yuv_bgr(allocOut);

            //Save to byte array, BGR 24bit
            allocOut.copyTo(frameBGR);

            int w = allocOut.getType().getX();
            int h = allocOut.getType().getY();

            if (listener != null) {
                listener.onImageAvailable(frameBGR, w, h);
            }
        }
    }

    public interface ImageListener {

        /**
         * Called when there is available image, image is in upright position.
         *
         * @param bgr BGR 24bit bytes
         * @param width image width
         * @param height image height
         */
        void onImageAvailable(byte[] bgr, int width, int height);
    }
}

RS

#pragma version(1)
#pragma rs Java_package_name(com.affectiva.camera)
#pragma rs_fp_relaxed

//Script convers YUV to BGR(uchar3)

//current YUV frame to read pixels from
rs_allocation currentYUVFrame;

//input image rotation: 0,90,180,270 clockwise
uint32_t rotation;
uint32_t inWidth;
uint32_t inHeight;

//method returns uchar3  BGR which will be set to x,y in output allocation
uchar3 __attribute__((kernel)) yuv_bgr(uint32_t x, uint32_t y) {

    // Read in pixel values from latest frame - YUV color space

    uchar3 inPixel;
    uint32_t xRot = x;
    uint32_t yRot = y;

    //Do not rotate if 0
    if (rotation==90) {
      //rotate 270 clockwise
      xRot = y;
      yRot = inHeight - 1 - x;
    } else if (rotation==180) {
      xRot = inWidth - 1 - x;
      yRot = inHeight - 1 - y;
    } else if (rotation==270) {
      //rotate 90 clockwise
      xRot = inWidth - 1 - y;
      yRot = x;
    }

    inPixel.r = rsGetElementAtYuv_uchar_Y(currentYUVFrame, xRot, yRot);
    inPixel.g = rsGetElementAtYuv_uchar_U(currentYUVFrame, xRot, yRot);
    inPixel.b = rsGetElementAtYuv_uchar_V(currentYUVFrame, xRot, yRot);

    // Convert YUV to RGB, JFIF transform with fixed-point math
    // R = Y + 1.402 * (V - 128)
    // G = Y - 0.34414 * (U - 128) - 0.71414 * (V - 128)
    // B = Y + 1.772 * (U - 128)

    int3 bgr;
    //get red pixel and assing to b
    bgr.b = inPixel.r +
            inPixel.b * 1436 / 1024 - 179;
    bgr.g = inPixel.r -
            inPixel.g * 46549 / 131072 + 44 -
            inPixel.b * 93604 / 131072 + 91;
    //get blue pixel and assign to red
    bgr.r = inPixel.r +
            inPixel.g * 1814 / 1024 - 227;

    // Write out
    return convert_uchar3(clamp(bgr, 0, 255));
}
0
Andrei .F

Re:RSIllegalArgumentException

私の場合、これはbuffer.remaining()がストライドの倍数ではなかった場合でした:最後の行の長さがストライドよりも短かった(つまり、実際のデータがあった場所までのみ)。

0