C2C信用風險的博弈分析
佚名
內容摘要:伴隨著互聯網的普及,C2C作為一種商業模式在我國高速發展,然而C2C作為互聯網的產物也有其不足之處,其中買賣雙方的信用風險是學者們關注的焦點。本文主要從博弈的角度研究了信用反饋系統是如何解決信用問題的,并由此得出了相關結論。 關鍵詞:C2C 信用風險 博弈 信用 反饋系統 自2000年以來,我國的C2C (Customer to Customer)電子商務發展迅速,然而相對于B2B (Business to Business)和B2C (Business to Customer)而言,它的風險更大。 越來越多的C2C拍賣網站提供信用反饋系統(如易貝的“反饋論壇”)來解決這些問題。反饋系統的運作能達到預期的效果嗎?Kollock(1999)概念性地概括了在線信譽系統并認為它們能有效管理無保證交易的風險。國內也對C2C中的誠信問題做了一些研究。曾勇等(2004)運用完全信息靜態博弈和完全信息動態博弈的方法對電子商務中買賣雙方之間的關系進行了分析研究。本文結合前人的研究,先回顧了一般靜態博弈模型,然后建立了采用信譽反饋系統的多次博弈模型。 C2C中信用欺詐存在的領域 在以往文獻中對于欺詐的定義很多,有的是指交付風險,有的則是指出賣劣質商品。在采用了第三方結算之后,有必要對新情況下所能實施的欺詐做出界定。 Darby & Karni指出商品從信息是否可知角度分為搜尋型商品、經驗型商品和信任型商品。“搜尋”特質是說在購買之前的搜尋過程中就能確定其品質,例如書籍;“經驗”特質是說只有在購買并使用之后才可以確定其品質,例如食品罐頭;“信任”特質是說,即使購買和正常使用以后短期內也無法確定品質,要了解其品質需要花費高昂的成本,例如闌尾切除手術。 類似支付寶的第三方結算是以如下方式運行的:它首先從買方獲得支付商品的金額,在收到買方的足額支付后它通知賣方發貨,買方在收到貨并確認滿意后再通知它付錢給賣方,最后它把買方先前存入的錢打到賣方賬戶。 這樣,買賣雙方沒有了交付風險。同時由于買方在收到貨物滿意后才通知第三方付款,所以搜尋型商品理論上就不存在欺詐的空間。信任型商品由于質量通常很難評估,買家幾乎不會在信任度不高的網絡上購買,而是在現實社會中的專業機構購買。因此,C2C電子商務留給欺詐的空間就只剩經驗型商品領域了。 C2C交易中的完全信息靜態博弈 (一)基本假設 基本假設:博弈只存在兩個參與人:買家和賣家,且兩者都是理性的經濟人且是風險中性的;雙方的交易決策或信用選擇抽象為兩種理想情況:賣家的行動選擇有誠信(不行騙)和欺詐(行騙),買家的行動選擇有買和不買;虛擬市場信息是完全的,即交易雙方對相互的戰略空間和支付函數有準確的知識;存在有效的監督機制,即賣家不誠信就會受到監督機構查處并遭受懲罰,產生負收益;買賣雙方只參加一次博弈且做出決策之前都不知道對方的行動,可以認為他們的行動是同時進行的,即兩者間博弈是靜態博弈。 (二)模型的建立與求解 在單次靜態博弈中,博弈雙方的策略等于行動。根據基本假設得到買家和賣家的支付矩陣。如表1所示。 賣家誠信時,買家因購買而獲得的收益為R1,賣家誠信經營的收益為R2;賣家欺詐獲得的收益為R3,賣家因欺詐而受到的法律法規的懲罰等造成的經濟損失為C,則賣家因欺詐而獲得的凈收益為R3-C。此時,選擇買的買家會因賣家欺詐得到-R1挼氖找妗H袈蚣也還郝虻幕埃敲次蘼勐艏已≡袷裁床唄運降氖找婢恪F壅┲越肼艏業男卸占洌且蛭梢醞ü越仙俚某殺咎峁┘倜拔繃硬返玫接牒細襠唐吠氖杖耄庋壅┱叩氖找婊岜浯螅碦2≤R3。 現實中買家起訴賣家欺詐行為的成本很高,很多受欺詐的買家選擇放棄起訴而自認倒霉,并且法律對于C2C電子商務中的欺詐懲罰并沒有那么嚴厲,這些致使欺詐給賣家自己帶來的期望損失不大,即03-R2,對應的純策略納什均衡為(欺詐,不買),此時交易應該不可能發生。那為什么C2C電子商務會發展成上百億的規模呢?這是因為很多賣方想做長期生意,而且信譽反饋系統作為記錄賣家信用的工具對整個C2C電子商務的成功運行貢獻相當大。 C2C交易中的不完全信息重復博弈 (一)“冷酷策略”的局限性 曾勇等(2004)對重復博弈問題的求解用的是無名氏定理。然而,現實中的現象是競爭對手可能充當買家,給賣家一個欺詐的評價,或者某些比較苛刻的買家給原本誠信的行為一個差評,以致后來的其他買家按照“冷酷策略”將不再和賣家交易,此時的賣家將是有苦難言,所以說“冷酷策略”要求太高了。實際上,買家不可能絕對不允許賣家有差評,而是會綜合賣家的信用級別和其他買家給該賣家差評的理由,來判斷該賣家的誠信度,最終來決定是否從該賣家購買商品。 (二)T+2次重復博弈模型 模型假定:只存在兩類參與人:數個買家和一個賣家,且買賣雙方都是理性的經濟人并且是風險中性的;雙方的信用選擇或交易決策抽象為兩種理想情況:賣家的行動選擇有誠信(不行騙)和欺詐(行騙),買家的行動選擇有買和不買;買賣雙方做出決策之前都不知道對方的行動,可以認為他們的行動是同時進行的;賣家先前已經進行了T次博弈并形成了數值為M的信用記錄;買家只要和賣家發生交易就給賣家一個信用評價,要么是誠信要么是欺詐,若沒有購買商品就不能給賣家評價,而賣家交易一次若被評價為誠信,其信用記錄增加1,若被評價為欺詐,則其信用記錄減少1;虛擬市場信息是不完全的,即交易雙方對相互的戰略空間和支付函數有準確的知識,但賣方知曉自己再做一段時間就終止買賣,而買家不知道賣家什么時候終止買賣,只有根據賣家的信用記錄做決策,從而決定購買概率a,而購買概率a是賣家信用的增函數,即在其它條件(如價格)不變的前提下,賣家信用越高,買家購買的可能性就越大,并且0≤a(*)≤1;假設賣家估計最后的這段時間先后會有兩位顧客光顧;存在的監督機制作用不大,即賣家欺詐不一定會受到監督機構查處并遭受懲罰,即使受到懲罰其期望損失也不大,甚至可以忽略,即C=0。 因為假定賣家從事有限次交易,之前已經進行了T次交易,并積累了信用等級M,而圖1表示的為最后兩次可能發生的交易。右邊01-20表示的是買賣雙方博弈之后的收益。兩次交易的買家可能一樣也可能不一樣,模型假定為不一樣,若一樣對最終的結論影響不大。博弈的順序是賣家和買家甲同時做決策,對買家甲來講其信息集是兩個不可分離的決策點,所以與甲的博弈是一次靜態博弈。同樣,最后一次博弈,賣家和買家乙進行的也是一次靜態博弈。假定買家甲、乙不知道賣家所從事的是最后兩次交易,因而甲、乙在交易中選擇行動買的概率a是基于他們所能看到的最新信用記錄(圖1已用下劃線表示出來),而賣家知道與買家乙進行的是最后一次交易,對賣家而言,此博弈和第二段中的靜態博弈一樣,用劃線法可以求得賣家必然要選擇欺詐,這符合賣家的利益最大化選擇。既然賣家在最后一次交易即與乙的交易選擇欺詐,那么在倒數第二次即與甲的交易中將選擇什么呢?
在進一步討論之前,先假定兩筆交易的貼現因子為δ。則賣家在與甲的交易中選擇誠信的收益表示為: π=a(M)(R2+δ[a(M+1)*R3+(1-a(M+1))*0)]+(1-a(M))(0 +δ[a(M)*R3+(1-a(M))*0])(1) 而選擇欺詐的收益為: π'=a(M)(R3+δ[a(M-1)*R3+(1-a(M-1))*0])+(1-a(M))(0 +δ[a(M)*R3+(1-a(M))*0])(2) 賣家選擇誠信的條件為π>π',整理得到a(M+1)-a(M-1)>(R3-R2)/(δR3)(3) 條件(3)式意味著,最后一階段買家根據上一階段賣家選擇誠信帶來的信用記錄決定的購買概率與根據上一階段賣家欺詐的信用記錄所決定的購買概率差值,若大于(R3-R2)/(δR3)的話,那么賣家在自己的倒數第二次交易中將選擇誠信;若小于(R3-R2)/(δR3)的話,賣家將選擇欺詐;若等于(R3-R2)/(δR3)的話,誠信和欺詐無差異。 在a(M+1)- a(M-1)一定并且δ接近于1的情況下,若R3越接近R2的話,(R3-R2)/(δR3)將越小,那么(3)式成立的幾率將越大。也就是說,當欺詐能帶來的收益比誠信取得的收益大得不多的話,(R3-R2)/(δR3)可能就比較小,這樣(3)式就比較容易滿足,賣家就不會選擇欺詐而是選擇誠信。 此外模型原本假設賣家欺詐所要承擔的期望損失C=0。若C≠0,則(3)式變為: a(M+1)-a(M-1)>(R3-C-R2)/(δ(R3-C))(4) 顯而易見(R3-C-R2)/(δ(R3-C))<(R3-R2)/(δR3),也就是說法律如果能更有效地制裁欺詐的話,賣家在倒數第二階段就會更有可能選擇誠信。而且(R3-C-R2)/(δ(R3-C))是C的減函數,這就意味著,若賣家欺詐所承受的期望成本C越大,(R3-C-R2)/(δ(R3-C))就越小,等式(4)也就越容易滿足,即賣家采取誠信的可能性就越大。 結論 本文分別運用了一次靜態博弈、倒數兩次博弈的方法,就采取第三方結算之后信用記錄系統的有效性問題展開研究。 在一次靜態博弈中,如果隨著執法和懲戒力度的加強,欺詐所要承擔的成本C越大,賣家就有可能從原來的欺詐變為誠信。在倒數兩次博弈的倒數第二次交易中,在其它條件不變的情況下,如果C越大,賣家采取誠信的條件就越容易滿足,賣家采取誠信的可能性就越大。所以從政策的角度應該嚴懲欺詐來營造誠信的交易環境。 研究還發現,在執法不嚴的情況下,有限博弈的最后一次,理性的賣家肯定選擇欺詐。然而在倒數兩階段博弈中買家的購買率如果符合a(M+1)-a(M-1)>(R3-R2)/(δR3)的話,就會迫使賣家在倒數第二階段采取誠信。在此基礎上給出了一個猜想,如果賣家還想做更長生意的話,那么a(M+1)-a(M-1)只要超過一個極小的值,賣家就會采取誠信。