«Решето Эратосфена»
Решил вот попробовать быстродействие поиска простых чисел методом "решета". Получилось как-то совершенно медленно. Я построил битовую маску, где каждому простому числу соответствует единичный бит.
Выделил 1ГБ оперативки (т.е. поиск простых от 2 до [2³³-1]). На простые от 2 до 63 ушло 17.3 секунды. Остальные простые в 8 потоков (т.к. здесь уже смело можно openmp использовать: шанс на коллизию сильно снижается) считаются еще 183 секунды. Если учесть, что "в лоб" все это вычислялось 3.5 минуты, похоже, таки gcc на всякий случай воткнул синхронизацию при выставлении маски.
#include <stdio.h>
#include <stdint.h>
#include <string.h>
#include <stdlib.h>
#include <omp.h>
#include <usefull_macros.h>
// 1GB of RAM
#define MASKSZ (1073741824L)
#define MNUMBERS (MASKSZ*8)
static uint8_t *masks;
static inline __attribute__((always_inline)) uint8_t get(uint64_t idx){
register uint64_t i = idx >> 3;
register uint8_t j = idx - (i<<3);
return masks[i] & (1<<j);
}
static inline __attribute__((always_inline)) void reset(uint64_t idx){
register uint64_t i = idx >> 3;
register uint8_t j = idx - (i<<3);
masks[i] &= ~(1<<j);
}
int main(){
masks = malloc(MASKSZ);
memset(masks, 0b10101010, MASKSZ); // without even numbers
masks[0] = 0b10101100; // with 2 and withoun 0 and 1
double t0 = dtime();
for(uint64_t i = 3; i < 64; i += 2){
if(get(i)){
for(uint64_t j = i*2; j < MNUMBERS; j += i){
reset(j);
}
}
}
printf("\tfirst 64: %g\n", dtime()-t0);
omp_set_num_threads(8);
#pragma omp parallel for
for(uint64_t i = 65; i < MNUMBERS; i += 2){
if(get(i)){
for(uint64_t j = i*2; j < MNUMBERS; j += i){
reset(j);
}
}
}
printf("\tfull table: %g\n", dtime()-t0);
for(uint64_t i = 0; i < 1000; ++i){
if(get(i)) printf("%zd\n", i);
}
return 0;
}
Выделил 1ГБ оперативки (т.е. поиск простых от 2 до [2³³-1]). На простые от 2 до 63 ушло 17.3 секунды. Остальные простые в 8 потоков (т.к. здесь уже смело можно openmp использовать: шанс на коллизию сильно снижается) считаются еще 183 секунды. Если учесть, что "в лоб" все это вычислялось 3.5 минуты, похоже, таки gcc на всякий случай воткнул синхронизацию при выставлении маски.