大數(shù)據(jù)氣象災害預測分析
王舒韻
摘要:中國是世界上唯一大面積種植苦蕎的國家,其中定西通渭縣是甘肅中部苦蕎的集中產(chǎn)區(qū)。根據(jù)近年來對苦蕎越來越多的需求、天氣對苦蕎產(chǎn)量的巨大影響,我們將采用Soikit-Learn的線性回歸模型以及Spark算法預測天氣,最后以數(shù)據(jù)可視化的方法呈現(xiàn)預測結(jié)果,從而降低天氣對定西通渭縣苦蕎產(chǎn)量的影響。
關(guān)鍵詞:農(nóng)業(yè)氣象災害;Spark算法;線性回歸模型;大數(shù)據(jù)預測分析
1 定西市通渭縣農(nóng)業(yè)氣象災害的定義與特征
1.1 通渭縣蕎麥發(fā)展現(xiàn)狀
通渭縣華家?guī)X特別適宜苦蕎的生長發(fā)育,產(chǎn)量較高,品質(zhì)上乘,一直是甘肅中部苦蕎的集中產(chǎn)區(qū)。近年來通過各級政府和干部群眾的共同努力,產(chǎn)業(yè)區(qū)域特征明顯,種植面積穩(wěn)中有增,并在引進優(yōu)良品種的基礎上爭取項目支持、開發(fā)特色產(chǎn)品和拓寬銷售渠道,采取了一系列行之有效的措施,推動了苦蕎產(chǎn)業(yè)的較快發(fā)展,目前通渭縣苦蕎種植面積共計30.67km2 ,占糧食面積的3.5%,總產(chǎn)量約7360t。通渭縣蕎麥在種植技術(shù)不斷完善的過程中作物質(zhì)量也得到提升,據(jù)有關(guān)方面檢測,該地區(qū)所產(chǎn)苦蕎與四川涼山地區(qū)各類指標持平,主要成分蘆丁約占80%左右。通渭縣蕎麥發(fā)展業(yè)穩(wěn)中向好,并結(jié)合電商平臺為蕎麥的銷售提供便利,但密切被重視的仍然是蕎麥產(chǎn)量和生長問題。
1.2 通渭縣蕎麥發(fā)展優(yōu)勢
通渭縣氣候干旱、生態(tài)條件差,蕎麥是主要的復種作物,器抗旱、耐瘠性強,是一種備荒救災的優(yōu)良作物。針對本區(qū)域的地理條件,蕎麥種植可以有效緩解土壤壓力并改善并帶動本地區(qū)的經(jīng)濟發(fā)展,具有良好的發(fā)展價值。中國是世界上唯一大面積種植苦蕎的國家,隨著人民生活水平和質(zhì)量不斷提高,膳食結(jié)構(gòu)也隨之發(fā)生了變化,蕎麥可以起到很好的營養(yǎng)保健作用,越來越得到人們的青睞。通渭縣蕎麥發(fā)展有自己的特色,目前國內(nèi)外市場需求急劇增大,這項產(chǎn)業(yè)可以成為一個帶動區(qū)域經(jīng)濟發(fā)展的好方案。由于通渭縣的地區(qū)特征,貧困縣和農(nóng)村地區(qū)經(jīng)濟發(fā)展成為國家經(jīng)濟發(fā)展中重點關(guān)注的問題之一。在國家和政府的大力幫助和支持下,在蕎麥種植技術(shù)引進升級和銷售模式不斷完善的背景下,本地區(qū)的蕎麥發(fā)展具有巨大的發(fā)展前景。
1.3 存在的問題
定西市通渭縣蕎麥種植業(yè)隨著科技的進步和人才的引進,種植效益穩(wěn)步提升。尤其是近年來隨著農(nóng)村電商的迅猛發(fā)展,農(nóng)村蕎麥種植業(yè)有了更好的銷路并獲得了更大的收益。在蕎麥種植業(yè)發(fā)展向好的同時,蕎麥的產(chǎn)量一直都是需要密切關(guān)注的問題。我們從近年來針對蕎麥產(chǎn)量的研究中發(fā)現(xiàn),天氣因素的影響是最大也是最不可控的影響因素。其中最主要的天氣因素是干旱和洪澇這兩個極端災害。所以我們專門針對干旱和洪澇這兩個天氣因素對通渭縣苦蕎產(chǎn)量的影響進行詳細分析。
2 通渭縣農(nóng)業(yè)氣象災害對蕎麥生長具體的影響
2.1 干旱
甘肅省定西市是全國有名的干旱地區(qū),而通渭縣更是干旱十八縣之一,也是出了名的黃土高原干旱區(qū)。定西市的干旱又分為以下幾種:春旱為4 到5 月。春末初夏旱為5 月下旬至7 月上旬。伏旱為7 月中旬至8 月中旬。秋旱為8 月下旬至10 月上旬。從春旱,春末初夏旱,伏旱,秋旱逐年發(fā)生次數(shù)看,幾乎每年都有干旱發(fā)生,故又有“十年九旱”之說。從各干旱發(fā)生頻率看,秋旱頻率最高,春旱次之,伏旱最低。其次定西市因為地理位置的原因,同時因為年降水量在300 ~600mm之間,而蒸發(fā)量又高達1400mm,所以干旱情況比較常見。每年的降雨集中在七、八、九三個月份,其他的月份月降雨量較少,但因為蒸發(fā)量過大的問題,所以會導致干旱的發(fā)生,同時因為蕎麥對水分的要求比較高,水分過多或者過少都會影響蕎麥的產(chǎn)量,在生長期和成熟期要求水分相對要多一點,蕎麥的播種期是七月中旬,是定西市降雨量較多的時候,不用擔心水分的問題,但是在成熟期,也就是來年的三月到四月,因為降雨量的減少,加上蒸發(fā)量一直很大的問題,所以更應該注意水分的補充,不要因為成熟期的水分不夠而影響蕎麥的產(chǎn)量。
2.2 洪澇
定西市通渭縣的氣候是屬于南溫帶半濕潤和中溫帶半干旱區(qū)的混合氣候,年均氣溫可達5.7 ~7.7 ℃,沒有霜降的時間大約有122 天到160 天,年平均降雨量一般在350 ~600mm,主要降雨量一般集中在7 月、8 月和9 月這三個月,并且大部分時候是以暴雨的形式出現(xiàn),但是它的蒸發(fā)量卻在1400mm以上。以渭河為界大致分為北部黃土丘陵溝壑區(qū)和南部高寒陰濕區(qū)兩種自然類型。前者包括安定區(qū)和通渭、隴西、臨洮三縣和渭源。北部占全區(qū)總面積的60%,為中溫帶半干旱區(qū),降水較少,日照充足溫差較大;后者包括漳縣、岷縣兩縣和渭源南部,占全市總面積的40%,為暖溫帶半濕潤區(qū)海拔高氣溫低。定西市的降水量一般都集中在每年的7 月、8 月和9 月,在這三個月中,如果出現(xiàn)每小時降雨量在20mm左右而且長時間的持續(xù),出現(xiàn)這樣的情況就是人們口中所說的大暴雨,它所造成的影響是會導致一部分的蕎麥苗被雨水沖走,但是當雨水稍微小一點的時候,可能不會對蕎麥苗造成太大的損失。每次出現(xiàn)大暴雨并且持續(xù)時間較長就有一定概率會出現(xiàn)山洪泥石流和山體滑坡,這種情況的出現(xiàn)會導致泥石流和山體滑坡所沖下來的雨水夾雜著泥土和石頭,這些雨水會對蕎麥產(chǎn)生不可挽回的損害,蕎麥不僅會被沖走,更有甚者會被泥石所砸,對蕎麥造成大面積的破壞。定西市蕎麥的生長周期一般在7 月中旬播種,所以每年的大降雨會導致蕎麥的產(chǎn)量下降,所以我們對洪澇以及它所帶來的一些其他災害要好好預防,使蕎麥的產(chǎn)量不會因為洪澇的原因減少。
2.3 霜凍
霜凍的發(fā)生概率不是很穩(wěn)定,每年發(fā)生的時間也不太確定,一般在2 月份到3 月份之間,但是霜凍對蕎麥的影響是最大的,因為蕎麥最畏懼的就是霜凍,霜凍會使蕎麥的產(chǎn)量急速下降,再加上霜凍的隨機性,使得它成為最不可控的因素,霜凍的發(fā)生會使得蕎麥停止生長,慢慢枯萎,所以我們應該好好預防霜凍。
3 大數(shù)據(jù)技術(shù)對氣象災害的預測方案
做好蕎麥的預防工作,應盡可能減少定西市通渭縣地區(qū)的不可估量的損失。能做的就是加快5G網(wǎng)絡、數(shù)據(jù)中心等新型基礎設施建設。要注重調(diào)動對這些先進技術(shù)與方式的學習與應用的積極性。加快5G網(wǎng)絡的建設,需要基于OFDM優(yōu)化的波形和多址接入,然后實現(xiàn)可擴展的OFDM間隔參數(shù)配置,可支持多種部署模式的不同信道寬度,適應統(tǒng)一部署下不同的參數(shù)配置,在同一框架下提高多路傳輸效率。OFDM加窗可以提高多路傳輸效率,并且需要靈活的框架設計。需要的新型無線技術(shù)有:① 大規(guī)模MIMO。通過天線的二位排布,可以實現(xiàn)3D波束成型,提高信道容量和覆蓋;② 毫米波。將頻率大于24GHz以上的頻段應用于移動寬帶通信,大量可用的高頻段頻譜可提供極致數(shù)據(jù)傳輸速度和容量。③ 邊緣計算。5G要實現(xiàn)低延時,就需要用到邊緣計算,要在基站上建立計算和存儲能力,在靠近物或數(shù)據(jù)源頭的一側(cè),采用網(wǎng)絡、計算、存儲、應用核心能力為一體的開放平臺,就近提供最近短服務,在最短的時間完成計算,發(fā)出指令。這樣,在預測分析后,可以用最快的速度發(fā)送給每一位種地的人,并且在發(fā)送的同時會像人工智能一樣將問題返回云端并且搜索數(shù)據(jù)庫中的解決方法,一并發(fā)給需要的人。所以為此,首當其沖就是建好5G基站,先建立完整的5G環(huán)境體系。然后通過宣傳和下鄉(xiāng)教學,讓所有人都能突破現(xiàn)有的條件束縛。使用SciKit-Learn的線性回歸模塊預測天氣。現(xiàn)在我們已經(jīng)完成了選擇具有統(tǒng)計意義的預測指標(特征)的步驟,我們可以使用SciKit-Learn創(chuàng)建預測模型并測試其預測平均溫度的能力。SciKit-Learn是一個非常完善的機器學習庫,在工業(yè)界和學術(shù)界廣泛使用。關(guān)于SciKit-Learn的一件事非常令人印象深刻的是,它在許多數(shù)值技術(shù)和算法中保持了一個非常一致的“適應”,“預測”和“測試”API,使得使用它非常簡單。除了這個一致的API設計,SciKit-Learn還提供了一些有用的工具來處理許多機器學習項目中常見的數(shù)據(jù)。我們將通過SciKit-Learnsklearn.model_selection模塊中導入train_test_split()函數(shù)來開始將我們的數(shù)據(jù)集分割成測試和訓練集。我將把訓練和測試數(shù)據(jù)集分成80 %的訓練和20 %的測試,并且分配一個12 的random_state,以確保得到隨機選擇數(shù)據(jù)。這個random_state參數(shù)對結(jié)果的可重復性非常有用。我將從sklearn.linear_model模塊導入并使用LinearRegression類。正如前面提到的,scikit-learn分數(shù)通過通用的fit()和predict()這兩個函數(shù)計算得到。為了獲得關(guān)于模型有效性的解釋性理解,我使用了回歸模型的score()函數(shù)來確定該模型能夠解釋在結(jié)果變量(平均溫度)中觀察到的約90 %的方差。此外,我使用sklearn.metrics模塊的mean_absolute_error()和median_absolute_error()來確定平均預測值約為3 ℃關(guān)閉,一半時間關(guān)閉約2 ℃。數(shù)據(jù)獲取分析主要使用SparkSQL相關(guān)知識與技術(shù),對定西市過去24 小時累積降雨量和當日平均氣溫進行了計算和排序。特別說明:由于獲取數(shù)據(jù)所需時間較長,天氣數(shù)據(jù)的時間跨度可能略有不一致。相關(guān)步驟如下:(1 )創(chuàng)建SparkSession對象spark。(2 )使用spark.read.csv(filename)讀取passed_weather_ALL.csv數(shù)據(jù)生成Dateframedf。(3 )對df進行操作:使用Dateframe的select方法選擇province,city_name,city_code,rain1h字段,并使用Column對象的cast(dateType)方法將rain1h轉(zhuǎn)成數(shù)值型,再使用Dateframe的filter方法篩選出rain1h小于1000 的記錄(大于1000 是異常數(shù)據(jù)),得到新的Dateframedf_rain。(4 )對df_rain進行操作:使用Dateframe的groupBy操作按照province,city_name,city_code的字段分組,使用agg方法對rain1h字段進行分組求和得到新的字段rain24h(過去24 小時累積雨量),使用sort方法按照rain24h降序排列,經(jīng)過上述操作得到新的Dateframedf_rain_sum。(5 )對df_rain_sum調(diào)用cache()方法將此前的轉(zhuǎn)換關(guān)系進行緩存,提高性能。(6 )對df_rain_sum調(diào)用coalesce()將數(shù)據(jù)分區(qū)數(shù)目減為1 ,并使用write.csv(filename)方法將得到的數(shù)據(jù)持久化到本地文件。(7 )對df_rain_sum調(diào)用head()方法取前若干條數(shù)據(jù)(即24 小時累積降水量Top-N的列表)供數(shù)據(jù)可視化使用。數(shù)據(jù)預測結(jié)果主要依靠數(shù)據(jù)可視化方式呈現(xiàn),基于spark獲取和分析的數(shù)據(jù),我們針對以1971-2016 年該區(qū)域的日均氣溫、最高溫、最低溫、降水量做出一個回歸模型,再以2017-2020 年該區(qū)域的日均氣溫、降水量為參數(shù)進行氣象預測工作并通過3D立體效果可視化到界面。通過這些方法針對定西市影響蕎麥生長的干旱和洪澇因素作預測,使農(nóng)民有效的預防并制定具體措施。
4 針對通渭縣氣象災害的綜合對策
4.1 增強環(huán)境保護意識,降低氣候惡化程度
在全世界發(fā)展的同時,地球的環(huán)境也發(fā)生著巨大的變化。從最開始的全球變暖到現(xiàn)在的自然災害愈加頻繁,嚴重影響農(nóng)作物的生產(chǎn)。其一是旱災,很常見的一種自然災害,在近幾年,我省通渭縣因旱災導致農(nóng)作物受災面積將近170km2 ,造成直接經(jīng)濟損失1 億元。其二就是洪澇,一般在六七月份比較嚴重,因短期強降雨造成了我省農(nóng)作物受災面積達到500km2 ,直接經(jīng)濟損失4.79 億元。其三是低溫冷凍和雪災,在2-5 月份的時候,降雪引發(fā)的低溫冷凍災害是最為嚴重的,造成我省11 個市農(nóng)作物受災面積將近7000km2 。其四災害天氣為風雹,我省多市出現(xiàn)冰雹強風天氣,導致農(nóng)作物不同程度受到影響,農(nóng)作物受災面積達到367.9km2 。最后一種為火災,火災一旦發(fā)生,造成的危害是巨大的,不僅僅使得農(nóng)作物受災嚴重,使得經(jīng)濟上有所損失,更加難以修復的危害則是造成了環(huán)境污染。火災發(fā)生,一氧化碳與二氧化碳的大量釋放,導致全球變暖更為嚴重。而在這些原因中,在我們所調(diào)查的地區(qū)――定西通渭縣,最常見的是洪澇與干旱。環(huán)境惡化造成自然災害,災害又導致經(jīng)濟受損與環(huán)境污染。往復循環(huán),造成難以挽救的傷害。因此,應該如何提高環(huán)境保護意識。第一,在現(xiàn)實生活中,可以借助媒體來宣傳環(huán)境保護的意義,提高人們保護環(huán)境的意識,呼吁人們保護環(huán)境的決心。我國人民的文化素質(zhì)在改革開放以來不斷提高,但是道德素質(zhì)還有待改進,尤其在邊緣城市,表現(xiàn)的格外明顯,我們應提高人民的道德素質(zhì),從而更好地灌輸環(huán)境保護意識,在這方面還有很大的提升空間。第二,就是決定國家未來走向的教育事業(yè),青少年強,則國家富有強大。環(huán)境保護意識從教育中入手,他們是祖國未來的希望,這樣做也是為了以后環(huán)境的發(fā)展作考慮。第三,要結(jié)合理論與實踐。實踐是檢驗真理的唯一標準,只有進行實踐,我們做的每一個項目才有意義,才能起到它應該有的作用。當然環(huán)境保護也是如此,我們不能一味的呼吁,教育,更重要的是人們能夠自覺地維護我們的家園。
4.2 建立氣象災害防治工作長期預測
在保護環(huán)境之后,只是起到了一個減少災害發(fā)生概率的作用。而要做到更大程度的保護農(nóng)作物,還需要科技的支持,現(xiàn)如今,在物聯(lián)網(wǎng)、云計算、大數(shù)據(jù)三大巨頭風靡的這個時代,我們應更好地利用它。為我們所研究的作物支持更好的生存環(huán)境,為當?shù)厝嗣裰\取更大的福利。我們所研究的方向主要為蕎麥所受氣象災害的影響。農(nóng)業(yè)預測數(shù)據(jù)的技術(shù)是一個龐大的數(shù)據(jù),異構(gòu)數(shù)據(jù)的復雜度高,結(jié)果是數(shù)據(jù)的分析效率低下,因此我們采用k最近鄰組織算法和分布式并行處理方法。大數(shù)據(jù)融于氣象災害預測是一個不二的選擇,大數(shù)據(jù)的預測結(jié)果有更強的確定性和可操作性,讓非常規(guī)的氣象災害在發(fā)生之前有一定的預兆,讓人們有時間去準備充足的防御措施。而利用大數(shù)去預測氣象,就好比建立了一個非常巨大的數(shù)據(jù)庫,在這個數(shù)據(jù)庫中存儲著利用遙感以及其他技術(shù)所收集的一些樣本數(shù)據(jù),從中可以得到海量數(shù)據(jù),然后經(jīng)過數(shù)據(jù)分析、數(shù)據(jù)清洗以及數(shù)據(jù)集成得到有價值的數(shù)據(jù),也就是說可以幫我們預測氣象災害的數(shù)據(jù)。氣象部門是防災減災的核心部門,在建立好數(shù)據(jù)分析體系以后,在現(xiàn)在看來只靠技術(shù)是不行的,如何防護才是減少損失的關(guān)鍵。首先,需要建立一個風險的預警體系,我們可建立預警所用的紅外線,當大數(shù)據(jù)分析利用所提供的樣本數(shù)據(jù)分析出結(jié)果,它就可對這一結(jié)果做出實時反應,從而縮短了氣象災害治理中的時間差,讓風險發(fā)生的概率降低或者讓災害所造成的損失降到最低。蕎麥的經(jīng)濟價值很高,它已經(jīng)成為了很流行的保健品之一。它的生長周期大概在九個月左右,一般在立秋的時候播種,在次年的五月份左右收割。而在這期間,我們要利用大數(shù)據(jù)技術(shù)、云計算、人工智能等對它進行實時監(jiān)控與保護。蕎麥怕霜凍,因此我們要知道蕎麥播種前后的氣象變化,不能出現(xiàn)急劇的降溫天氣,也不能出現(xiàn)冰雹等氣象災害。還有防旱,通過氣象預測平臺了解蕎麥在生長周期期間是否會出現(xiàn)旱災的情況,從而制定相應的應對方案。利用大數(shù)據(jù)技術(shù)分析出風險因素,從而制定出合理的預防方案。
4.3 幫助農(nóng)民樹立正確的防災觀念
從古至今,農(nóng)民的觀念里都是靠天吃飯。那么如何正確防災,是需要向農(nóng)民普及的。首先,我們應該使得這次防災減災知識講座范圍大,場次多。我們應該多次舉行防災講座活動,并且要盡量動員大家都參加。為了是大家都知道,可由村干部下達命令,讓每戶人至少有一位參加。再者,我們灌輸思想的途徑要多,力度要大,可舉辦知識競賽,而且優(yōu)秀者有相應獎勵。可以在每天的24 小時之中,分時間段,在廣播中講解、傳輸防災減災的知識。講述當自然災害發(fā)生后如何應對,以及可用的應急措施。最后,可通過掛橫幅的方式,讓農(nóng)民耳濡目染這些東西,從而可以從容應對災害。如今,在短視頻爆火的時候,可借助短視頻APP傳播防災減災知識,它幾乎可以全面覆蓋我國地區(qū),傳播范圍廣,且人們?nèi)菀捉邮堋6桃曨l優(yōu)點有:可以提高品牌的知名度、節(jié)省人員的時間成本與經(jīng)濟成本、圖畫代替文字,更容易深入人心。所以在幫助農(nóng)名樹立正確的防災觀念這一方面,它也是一個很好的選擇。當大數(shù)據(jù)進入人們的生活,根據(jù)您的一切行為,推算出你所需產(chǎn)品,而農(nóng)民就是后臺推送如何才能讓莊稼大豐收的對象。總而言之,農(nóng)民依靠農(nóng)作物,國家需要農(nóng)作物保持經(jīng)濟平衡。好的防災意識是一個良好的習慣,使得損失降到最低。
5 結(jié)論
綜上所述,我們可以通過Spark算法,線性回歸模型,大數(shù)據(jù)預測可視化等方法去預測農(nóng)業(yè)氣象災害的發(fā)生情況,更好地保障農(nóng)民的財產(chǎn)安全,有效地促進我國農(nóng)業(yè)的可持續(xù)發(fā)展。
[1]楊子梅.通渭縣苦蕎產(chǎn)業(yè)發(fā)展現(xiàn)狀及對策[J].甘肅農(nóng)業(yè),2010(2):72-73.
[2]項立剛.5G的基本特點與關(guān)鍵技術(shù)[J].中國工業(yè)和信息化,2018,1(5):36-43.
[3]陳豐偉.5G的速度與激情[J].互聯(lián)網(wǎng)天地,2018(6):41-44.
[4]張?zhí)N.MassiveMIMO基于鏡像法的室內(nèi)信道建模[D].南京郵電大學,2018.
[5]張啟.通渭縣甜蕎麥高產(chǎn)栽培技術(shù)[J].甘肅農(nóng)業(yè),2005(10):182.
[6]張平軍.甘肅定西生態(tài)建設與畜牧經(jīng)濟發(fā)展――甘肅草原生態(tài)建設與畜牧業(yè)發(fā)展調(diào)查的分類研究[J].甘肅畜牧獸醫(yī),2016(19):40-42.
[7]徐文.淺談環(huán)境保護與如何提高公民環(huán)保意識[J].建筑工程技術(shù)與設計,2015(25):1790.
[8]孟宣辰.黃土高原旱作區(qū)種植結(jié)構(gòu)分析和紫花苜蓿覆膜施肥效應研究[D].蘭州大學,2016.
[9]田俊杰.紋理圖案主結(jié)構(gòu)的快速提取方法研究[D].湖北:華中科技大學,2018.