BZOJ 1076 SCOI2008獎勵關狀壓與期望DP

阿新 • • 發佈：2019-01-21

Problem

Problem Description

你正在玩你最喜歡的電子遊戲，並且剛剛進入一個獎勵關。在這個獎勵關裡，系統將依次隨機丟擲k次寶物，每次你都可以選擇吃或者不吃（必須在丟擲下一個寶物之前做出選擇，且現在決定不吃的寶物以後也不能再吃）。

寶物一共有n種，系統每次丟擲這n種寶物的概率都相同且相互獨立。也就是說，即使前k-1次系統都丟擲寶物1（這種情況是有可能出現的，儘管概率非常小），第k次丟擲各個寶物的概率依然均為 $\frac{1}{n}$ 。

獲取第 i 種寶物將得到Pi分，但並不是每種寶物都是可以隨意獲取的。第i種寶物有一個前提寶物集合Si。只有當Si中所有寶物都至少吃過一次，才能吃第i 種寶物（如果系統丟擲了一個目前不能吃的寶物，相當於白白的損失了一次機會）。注意，Pi 可以是負數，但如果它是很多高分寶物的前提，損失短期利益而吃掉這個負分寶物將獲得更大的長期利益。

假設你採取最優策略，平均情況你一共能在獎勵關得到多少分值？

Input

第一行有兩個正整數k和n，即寶物的數量和種類。以下n行分別描述一種寶物，其中第一個整數代表分值，隨後的整數依次代表該寶物的各個前提寶物（各寶物編號為1到n），以0結尾。

Output

輸出一個實數，保留六位小數，即在最優策略下平均情況的得分(即期望得分)。

Sample Input

1 2
1 0
2 0

6 6
12 2 3 4 5 0
15 5 0
-2 2 4 5 0
-11 2 5 0
5 0
1 2 4 5 0

Sample Output

1.500000

10.023470

Date Size

$1 <= k <= 100, 1 <= n <= 15$ ，分值為 $[- 106, 106]$ 內的整數。

Solution

首先某些物品既然可能會有前提集合Si，而題目條件中給出了n的範圍為 $1 <= n <= 15$ ，那麼很容易想到，利用狀態壓縮來進行判斷是否具備前提集合，即 $(s & s t a t e [i]) == s [i]$

很容易想到利用DP來解決問題，令s表示之前已經取過寶物的狀態，即用f[i][s]表示第i輪的狀態為s時的期望得分。但是有一點問題，我們無法判斷在i輪能否能到達s的狀態，也就是有可能這個儲存的答案其實是無效的。那麼我們就可以採用倒推的方法。期望DP常用到倒推。

我們知道， $E (x) = \sum P (i) * W (i)$ 。又因為每一輪甩出某種寶物的可能性均為 $\frac{1}{n}$ ，那麼就可以先計算期望得分的總和，最後再一次除。

由此：令s依然表示之前已經取過寶物的狀態，f[i][s]表示在第i到第k輪的期望得分。那麼這個答案的儲存位置就明確了，即f[1][0]。狀態轉移方程如下：

對於具備前提集合的，則有不取和取兩種狀態: $f [i] [s] + = m a x (f [i + 1] [s], f [i + 1] [s | (1 << j - 1)] + c [j])$

而不具備前提集合的，則只能選擇不取: $f [i] [s] + = f [i + 1] [s]$

Code

#include <algorithm>
#include <iostream>
#include <cstdio>
using namespace std;
int k,n,maxx,c[16],state[16];
double f[105][1<<15];
void input()
{
    int t;
    scanf("%d%d",&k,&n);
    for(int i=1;i<=n;i++)
    {
        scanf("%d",&c[i]);
        for(int j=1;;j++)
        {
            scanf("%d",&t);
            if(!t)
              break;
            state[i]|=(1<<t-1);
        }
    }
}
int main()
{
    input();
    maxx=(1<<n)-1;
    for(int i=k;i>=1;i--)
      for(int s=0;s<=maxx;s++)
      {
        for(int j=1;j<=n;j++)
        {
          if((s&state[j])==state[j])
            f[i][s]+=max(f[i+1][s],f[i+1][s|(1<<j-1)]+c[j]);
          else
            f[i][s]+=f[i+1][s];
        }
        f[i][s]/=n;
      }
    printf("%.6lf\n",f[1][0]);
    return 0;
}

BZOJ 1076 SCOI2008獎勵關狀壓與期望DP

Problem

Problem Description

Input

Output

Sample Input

Sample Output

Date Size

Solution

Code

BZOJ 1076 SCOI2008獎勵關狀壓與期望DP

[BZOJ 1076][SCOI2008]獎勵關（期望+狀壓Dp）

bzoj 1076: [SCOI2008]獎勵關(期望DP，狀壓。)

BZOJ 1076: [SCOI2008]獎勵關（期望+狀壓DP）

bzoj 1076: [SCOI2008]獎勵關

bzoj1076: [SCOI2008]獎勵關狀壓dp

BZOJ 1076 [SCOI2008]獎勵關【狀態壓縮】【期望DP】

[BZOJ1076][SCOI2008]獎勵關[狀壓DP+概率期望]

[bzoj 1076][SCOI2008]獎勵關

BZOJ 1076([SCOI2008]獎勵關-期望dp-從後向前)

bzoj 1076: [SCOI2008]獎勵關（期望dp）

bzoj 1076: [SCOI2008]獎勵關期望dp+狀態壓縮

BZOJ 1076 [SCOI2008]獎勵關

bzoj1076 [SCOI2008]獎勵關狀壓+期望dp

洛谷 P2473 [SCOI2008]獎勵關(狀壓dp+期望)

1076. [SCOI2008]獎勵關【狀壓DP+期望】

【BZOJ】1076 [SCOI2008]獎勵關

1076: [SCOI2008]獎勵關

[BZOJ1076]獎勵關-狀壓+期望

【bzoj 1076】[SCOI2008]獎勵關（狀壓dp+概率）

BZOJ 1076 SCOI2008獎勵關 狀壓與期望DP

Problem

Problem Description

Input

Output

Sample Input

Sample Output

Date Size

Solution

Code

相關推薦

BZOJ 1076 SCOI2008獎勵關狀壓與期望DP