日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

本文介紹了使用Spark-avro寫入數據幀創建topLevelRecord-要使用現有架構的處理方法,對大家解決問題具有一定的參考價值,需要的朋友們下面隨著小編來一起學習吧!

問題描述

我正在使用Kryo編碼器將GenericRecords編碼為Spark DataFrame,并將該數據幀寫入Avro文件。一旦我嘗試從配置單元中讀取文件,我就得到一個錯誤,說解析器找到的是toplevelRecords而不是預期的字段。這條記錄不在我現有的模式中,我認為它是在我使用Spark-Avro編寫時創建的。我想知道是否/如何從Avro文件中刪除它。

如下所示:

{
    "type":"record",
    "name":"topLevelRecord",
    "fields":[
         {
            "name":"value",
            "type":["bytes","null"]
         }
    ]
} 

推薦答案

名稱字段在Avro架構中是必需的(https://jaceklaskowski.gitbooks.io/mastering-spark-sql/spark-sql-AvroOptions.html)

如果架構中未設置值topLevelRecord,則值topLevelRecord是默認值,但是您可以提供一個值以在寫入數據框時覆蓋它。

Scala:
創建參數映射并將其傳遞給編寫器:

val name = "AvroTest"
val parameters = Map("recordName" -> name)
df.write.options(parameters).format("avro").save("/tmp/output")

引用:https://docs.databricks.com/spark/latest/data-sources/read-avro.html

Python:
將選項傳遞給編寫器,如下所示:

df.write.format("com.databricks.spark.avro").option("recordName", "Uber").save("tmp/output")

這篇關于使用Spark-avro寫入數據幀創建topLevelRecord-要使用現有架構的文章就介紹到這了,希望我們推薦的答案對大家有所幫助,

分享到:
標簽:Spark 寫入 創建 數據 架構 現有 要使
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定