一朵棉花里藏著從育種到加工的全產業鏈升級密碼。
在新疆廣闊的棉田里,棉農們最關心的是棉花的纖維品質和產量,近年來由于糧食安全的重要性,棉籽的品質也備受關注。過去,這些性狀的改良更多依靠經驗和運氣。如今,中國農業科學院棉花研究所(以下簡稱中棉所)多個研究團隊合作,利用多組學數據,首次系統解析了棉花胚珠發育早期代謝網絡與調控基因的動態互作機制。
新疆棉花。中國農科院棉花所供圖
這一研究成果11月3日在線發表于《自然—遺傳》雜志,研究揭示了MYB基因家族成員在陸地棉馴化過程中的調控樞紐作用,直接影響棉花最終的纖維長度、顏色以及棉籽的功能成分等性狀,為未來面向棉花資源全值高效利用多應用場景的精準分子育種提供了全新的理論視角和數據支撐。
小小棉籽的秘密
在棉花花朵的子房里,包含著多個將來會發育成棉籽的胚珠。
當棉花開花授粉后,這些胚珠的表皮細胞會開始“分化”。其中,一部分細胞會向外突起、伸長,最終發育成用來紡紗織布的棉纖維,俗稱皮棉。而胚珠本身在受精后則發育成棉籽。
棉纖維是棉花的主產品,用于紡織工業。而棉籽傳統上被視為副產品,但它渾身是寶:棉籽仁可以榨取棉籽油,是一種重要的食用植物油;榨油后的殘渣(棉籽粕)是優質的蛋白質飼料原料。
棉纖維的發育和種子的發育是同時進行的。它們共享著來自母體植株的營養和能量。
“和動物胚胎一樣,很多重要的表型在植物胚胎發育早期就已經決定了。”論文共同通訊作者、中棉所研究員杜雄明介紹,棉花最具經濟價值的器官就是纖維和種子(即棉籽),這項研究聚焦于棉花開花后5天的胚珠,因為胚珠發育早期正是纖維細胞分化凸起和快速伸長、種子開始發育的關鍵重疊時期。
前期大量研究表明,此時是基因表達最活躍的時期之一,大量影響纖維和種子最終表型的基因均在這個時期集中表達,代謝活動也極為旺盛,決定了后續纖維的產量、品質(如長度、強度)和種子的營養價值(如油脂、蛋白質含量)。
論文共同通訊作者、中棉所研究員何守樸說,研究切入點的選擇體現了團隊對棉花生物學特性的深刻理解。“纖維細胞的起始和伸長、棉籽營養成分的積累等重要生物過程,都在這個階段奠定基礎。”
“在我們開始這項研究之前,纖維發育遺傳和分子機制是棉花基礎研究領域最活躍的領域,鑒定到一大批關鍵基因,對纖維發育至關重要。但是對棉籽發育研究相對較少。”論文共同通訊作者、中棉所研究員馬磊說。
實際上,生物表型形成是一個多層級精細調控的復雜過程,包括了從核苷酸序列到基因、蛋白,再到代謝物,最后到表型的過程。何守樸強調,代謝物是較基因和蛋白更“接近”最終表型的指標。
他說,代謝組就是“基因—蛋白”與“表型”之間的“黑箱”。但過去的研究大多針對序列、蛋白、基因和表型獨立開展,不同層級之間的關系也不清楚。“我們團隊前期積累了大量的序列、基因和表型數據,只要摸清代謝物這個‘黑箱’,就可以繪制出一個早期胚珠和纖維發育的完整圖譜。”何守樸說。
研究團隊采用了大樣本多維度組學分析策略,對403份陸地棉種質資源花后5天的胚珠開展整合分析。這種大規模、多維度的研究方法在棉花研究領域并不多見。
基因“總調度員”和它的“開關”
經過五年攻關,研究團隊取得了一系列突破性發現。他們成功鑒定出2960個代謝數量性狀位點(mQTL)和24485個表達數量性狀位點(eQTL),構建了目前棉花領域最全面的“變異組—轉錄組—代謝組—表型組”數據庫。
“可以把我們的研究比作獲得了棉花群體早期胚珠較完整血液化驗單。”論文共同通訊作者、中棉所研究員崔金杰形象地比喻道,基因序列像人的先天體質,基因表達像機體對環境的即時反應,而代謝組就是那張“血液化驗單”。化驗單上的每一項指標,都是身體運行狀態的直接讀數,能把上游的基因指令與下游的可見“癥狀”(表型)連接起來。
他們對成百上千個代謝物做系統“化驗”,并與基因表達變化和最終表型逐一對照,找出哪些指標異常、對應哪條通路、可能源自于哪些關鍵基因。
他們在A07染色體上發現了一個重要的數量性狀“熱點”,大量的代謝物含量都與這個位點相關。論文第一作者、中棉所已畢業博士生張小萌連續數周熬夜處理了數千份棉花重測序數據,通過反復比較和團隊討論,最終確定了這個熱點區域中,候選基因GhTT2_A07在棉花纖維馴化過程中的關鍵角色。
“這個基因如同代謝網絡的總調度員。”張小萌介紹,“它原本在擬南芥中控制棕色種皮的形成,而在棉花里功能更復雜,不僅參與纖維著色,還調控脂肪酸和激素代謝。”GhTT2_A07基因表達量高了,棉纖維就表現出“短而棕”;反之則表現出“長而白”。這一發現可能解釋了棉花從有色野生種馴化為白色栽培種過程的關鍵分子機制。這一結果讓整個團隊都非常興奮。
在GhTT2_A07基因上游,他們還發現了一個約520Kb的基因組倒位,這個結構變異如同基因表達的“開關”。它改變了GhTT2_A07基因的啟動子結構,讓該基因在棕色纖維中活性增強,在白色纖維中降低。馬磊解釋,這一發現也提示,棉花從有色野生種馴化為白色栽培種時,基因組結構變異是關鍵機制之一。
此外,他們還發現了GhTT2_A07的一個“兄弟”基因——GhPAR。這兩個基因同為MYB家族成員,但存在明確的功能分工:GhTT2_A07在纖維起始和伸長階段活躍,廣泛影響著多種類黃酮類型,以及纖維品質和衣分;而GhPAR主要在胚珠早期發揮作用,主要調節原花青素類物質。
何守樸解釋說,棉花的衣分是一定量籽棉經過加工后生產出的皮棉與籽棉的重量比。衣分是衡量棉花產量的關鍵,也是棉花生產效益高低的標志,生產上衣分成為篩選棉花品種的首要指標。
“這種‘功能冗余保障+時空表達特異性’的機制,既保證了代謝穩定性,又為不同性狀的精準調控提供了靈活性。”何守樸說。
從“種什么賣什么”到“要什么種什么”
“基于海量代謝組數據,我們系統收錄了棉籽發育早期關鍵代謝物信息,結合成熟種子的營養常規評價,構建了可直接服務于下游產業的棉籽代謝物數據庫。它就像一份詳盡的棉籽分子成分說明書,清晰記錄不同品種棉籽中油脂、蛋白質及關鍵代謝物的含量信息。”馬磊告訴《中國科學報》。
育種家可借助數據庫精準定位控制出油率和蛋白質合成的關鍵基因,通過分子標記技術定向選育專用棉花品種;而下游棉籽加工企業則能依據數據庫中的成分數據,針對性挑選功能成分組成理想的棉籽原料。
“這項研究將為棉花分子設計育種帶來的最大變化是讓育種從經驗型變成精準型。”杜雄明說,通過系統分析,人們可以更加深入地理解不同性狀之間的關系以及背后的調控機制,最終可以權衡利弊,像“搭積木”一樣,組合不同的關鍵基因,兼顧纖維品質、產量和棉籽營養價值。
何守樸解釋道:“我們將根據紡織企業和棉籽加工企業的多元化需求,直接篩選攜帶不同基因配方的種質供育種家利用,定向培育出符合市場需求的棉花品種,真正實現從‘種什么賣什么’到‘要什么種什么’的產業變革。”
基礎研究與產業需求深度融合是團隊一貫堅持的研究理念。回顧多年的研究歷程,團隊表示最難的階段是整合403份棉花樣本的基因、代謝物和性狀數據,信息量巨大、關系錯綜復雜。而最讓人興奮的時刻是鎖定GhTT2_A07基因和它上游的520Kb倒位,這一發現正好解釋了棉花纖維顏色、長度和代謝物含量等多個性狀的形成機制,為理解棉花纖維的馴化提供了重要的證據。
“我們計劃利用這個數據庫和發現的關鍵基因,更加深入地分析這些基因如何協同調控纖維產量、品質和種子性狀的形成,同時將數據共享,供其他研究者進行更深入的分析。”杜雄明說,農業基礎研究歸根到底還是要先到實踐中去找問題,只有深度參與和了解產業問題,才能更高效地將科技轉換為田間的實際生產力,服務國家農業需求。
相關論文信息:https://www.nature.com/articles/s41588-025-02363-3
本文鏈接:打開棉花“總開關”:從經驗育種到多元化品種設計http://www.sq15.cn/show-11-27845-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
上一篇: 42歲教授的4年系主任生涯:一款現實版“戰略游戲”
下一篇: 徐洪杰:尋找“系統通解”的戰略科學家