如果沒有不成對的代理字符，我如何將表情符號等字符編碼為UTF8？-魔扣目錄

日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告：魔扣目錄網為廣大站長提供免費收錄網站服務，提交前請做好本站友鏈：【網站目錄：http://www.ylptlb.cn 】，免友鏈快審服務（50元/站），

網站：51998
待審：31
小程序：12
文章：1030137
會員：747

首頁 > 新聞資訊 > IT業界 >正文

如果沒有不成對的代理字符，我如何將表情符號等字符編碼為UTF8？

發布時間：2024-03-09 00:28:03 作者：網友整理

本文介紹了如果沒有不成對的代理字符，我如何將表情符號等字符編碼為UTF8？的處理方法，對大家解決問題具有一定的參考價值，需要的朋友們下面隨著小編來一起學習吧！

問題描述

我有包含各種字符的字符串，需要寫入Google BigQuery，它需要嚴格的UTF8字符串。在嘗試使用各種表情符號輸入編寫字符串時，我收到錯誤：

java.lang.IllegalArgumentException: Unpaired surrogate at index 3373
    at org.apache.beam.sdk.repackaged.com.google.common.base.Utf8.encodedLengthGeneral(Utf8.java:93)
    at org.apache.beam.sdk.repackaged.com.google.common.base.Utf8.encodedLength(Utf8.java:67)
    at org.apache.beam.sdk.coders.StringUtf8Coder.getEncodedElementByteSize(StringUtf8Coder.java:145)
...

我有一個解決此問題的方法，只需從字符串中刪除所有代理項字符：

    private static String removeSurrogates(String query) {
        StringBuilder sb = new StringBuilder();
        for (int i = 0; i < query.length(); i++) {
            char c = query.charAt(i);
            if (!(Character.isHighSurrogate(c) || Character.isLowSurrogate(c))) {
                sb.append(c);
            }
        }
        return sb.toString();
    }

但是，這會產生一個類似

的字符串

分享到：

標簽：UTF8 代理如何將如果沒有字符編碼表情符號